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| Introducción 


Las redes de ordenadores actuales son una amalgama de dispositivos, 
técnicas y sistemas de comunicación que han ido apareciendo desde fi- 
nales del siglo XIX o, lo que es lo mismo, desde la invención del teléfono. 
El teléfono, que se desarrolló exclusivamente para transmitir voz, hoy se 
utiliza, en muchos casos, para conectar ordenadores entre sí. Desde en- 
tonces han aparecido las redes locales, las conexiones de datos a larga 
distancia con enlaces transoceánicos o satélites, la telefonía móvil, etc. 
Mención especial merece la red Internet dentro de este mundo de las co- 
municaciones a distancia. Nadie duda de que hoy en día constituye una 


red básica de comunicación entre los humanos. 


Este curso ofrece una visión de las redes informáticas en general y de la 


red Internet en particular. 


En la primera parte, introduciremos las ideas y los conceptos básicos de 
las redes de ordenadores. Siguiendo un hilo histórico, presentaremos 
los diferentes mecanismos que se han utilizado y se utilizan para comu- 
nicarse a distancia. Presentaremos igualmente el concepto de arquitec- 
tura de protocolos, fundamental en sistemas distribuidos, y el modelo de 
referencia OSI como un ejemplo paradigmático de ello. Aunque hoy en 
día este modelo no disfruta de una gran popularidad, sus virtudes pe- 
dagógicas están más que demostradas: a partir de él es fácil estudiar y 
entender otras arquitecturas, como la arquitectura Internet en torno a la 


cual gira todo el curso. 


La segunda parte está dedicada al estudio de las redes de área local. 
Presentamos de forma descriptiva los diferentes tipos de redes que exis- 
ten, las ideas básicas de su funcionamiento y la noción de cableado es- 
tructurado, clave en el gran auge que han tenido últimamente las redes 


de área local. 


En la tercera parte se verán los fundamentos de la red Internet. Lo 
que se conoce como red Internet es un conjunto heterogéneo de re- 


des interconectadas. Precisamente, es la capacidad de homogenei- 
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Internet es un apócope de 


internetworking (interconec- 
tando redes). 





Las RFC se pueden consul- 


tar en la siguiente dirección: 


http://www. ietf.org. 
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zar lo que de hecho es heterogéneo, lo que ha catapultado la red 


Internet a su estatus actual. 


Los protocolos que distinguen la red Internet como una unidad son 
el IP (Internet protocol) y el TCP (Transmission control protocol). Estos 
protocolos no son los únicos, pero sí los más importantes de entre los 
que se necesitan para hacer funcionar la red Internet. Por este moti- 
vo, a todos en conjunto se les llama normalmente pila TCP/IP (TCP/ 
IP stack). 


En concreto, en esta parte se describe el protocolo IP y sus más inme- 
diatos colaboradores (ARP y ICMP), así como los mecanismos de ac- 
ceso a Internet de que disponemos: a través de una red de área local 
o un enlace telefónico, ya sea mediante PPP y un módem tradicional o, 


más recientemente, mediante ADSL. 


TCP/IP no es un estándar de iure. Ningún organismo internacional 
de estandarización se ha encargado de emitirlo. Por el contrario, el 
funcionamiento de sus protocolos está recogido en unos documentos 
llamados RFC (request for comments), que son propuestas que se han 
hecho sobre el funcionamiento de un protocolo concreto, o de una 
parte. El proceso es simple: una vez hecha pública una propuesta, si 
nadie pone ninguna objección, ya se considera aprobada y lista para 


ser implementada. 


Además de consultar este material didáctico y la bibliografía reco- 
mendada, en que se explican los protocolos de una forma pedagó- 
gica, se recomienda leer alguna RFC, aunque sólo sea para hacerse 


una idea del proceso que ha seguido la Red desde sus inicios 


En la cuarta parte, describiremos los protocolos de aplicación más 
utilizados actualmente en Internet y los programas más habituales 
que los implementan, como son la conexión remota (telnet, rlogin), 
la transferencia de archivos (FTP), el correo electrónico (SMTP, POP, 
IMAP), las news (NNTP), el WWW (HTTP) y la mensajería instantánea. 


Todos estos programas se conocen como aplicaciones distribuidas, 
puesto que están formadas por distintas partes que pueden estar 
ejecutándose en máquinas diferentes. Esta dispersión de partes de 


programas obliga a definir una manera de dialogar entre ellas. 


Veremos pues, antes de empezar la descripción de las diferentes 
aplicaciones, este concepto de programación distribuida y el mo- 


delo cliente/servidor que es el que sigue mayoritariamente. 


Las aplicaciones Internet permiten conocer las máquinas y los servi- 
cios a través de nombres, y no con números que es como trabajan 
IP, TCP y UDP. Alguien tiene que encargarse de la asociación de los 
nombres con las direcciones numéricas y este alguien es el servicio 
DNS (Domain Name System). También trateremos este tema antes de 


describir las aplicaciones. 
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| Objetivos 


Con los materiales de este curso se pretende que el lector alcance los 


objetivos siguientes: 


10. 


. Conocer las diferentes tecnologías que se utilizan en la actuali- 


dad para transmitir información a distancia, y comprender 


cuándo y por qué aparecieron. 


. Conocer el modelo de referencia OSI, sus utilidades y sus limita- 


ciones, y ser capaz de entender la motivación de cada uno de 


sus niveles. 


. Conocer los principios básicos de funcionamiento de las redes 


de área local tanto cableadas como inalámbricas, las topologías 


posibles y las diferentes políticas de acceso al medio. 


. Conocer el concepto de cableado estructurado, entender el pa- 


pel que en él juegan los concentradores y saber diferenciar to- 


pología física y topología lógica. 


. Entender los principios de funcionamiento del protocolo de nivel 


de red IP: la asignación de direcciones y el direccionamiento. 


. Aprender el funcionamiento de las redes de acceso a Internet 


más comunes: acceso LAN y acceso per red telefónica mediante 
PP o ADSL. 


. Entender el funcionamiento de los protocolos de transporte y sa- 


ber en qué principios se basan. 


. Conocer algunas utilidades de uso común que permiten descubrir 


algunas interioridades de estos protocolos de red y transporte. 


. Comprender el modelo cliente/servidor, que sirve como base de 


la implementación de aplicaciones distribuidas y el modelo peer- 


to-peer, complementario del anterior. 


Comprender el funcionamiento del DNS, el servicio de nombres 


de dominio, que da soporte al resto de aplicaciones. 
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11. Conocer las aplicaciones telnet y rlogin, que proporcionan el 
servicio de conexión remota a otros ordenadores (principalmen- 
te en el entorno GNU/Linux), y las aplicaciones que proporcio- 
nan en Internet los servicios de transferencia de archivos, correo 
electrónico, news, WWW y mensajería instantánea, y sobre todo 


los protocolos que siguen. 





l. Introducción a las redes 
de computadores 


| 1. Breve historia de las comunicaciones 


Desde que el ser humano tiene capacidad de comunicarse ha desa- 
rrollado mecanismos y sistemas que les permiten establecer esta co- 
municación a distancias superiores de las alcanzadas por sus 


propios medios. 


Al poco de aparecer los ordenadores, se sintió la necesidad de inter- 
conectarlos para que se pudiesen comunicar entre sí como lo hace- 


mos los humanos. 


En esta unidad nos planteamos repasar la historia de estos sistemas 
de comunicación, pensados para ser usados por los humanos y que, 


después, han ido evolucionando para interconectar ordenadores. 


Fijamos el inicio de este recorrido histórico en el teléfono. El teléfono 
no fue el primer sistema de telecomunicación, pero sí el más antiguo 
de los que hoy en día se utilizan habitualmente. Mucho antes se ha- 
bían utilizado sistemas ópticos que, con la luz del sol y juegos de es- 
pejos, permitían comunicarse desde distancias considerables. Con 
posterioridad, a mediados del siglo XIX, se inventó el telégrafo. Estos 
sistemas, sin embargo, han caído en desuso (excepto usos margina- 
les), mientras que la red telefónica se mantiene como un sistema de 


comunicación de primer orden. 


| 1.1. El teléfono 


En 1878, Alexander Graham Bell mostró su “máquina eléctrica par- 
lante” y cómo podía mantener una conversación a distancia entre 


dos de estos aparatos unidos por un hilo eléctrico. 





Nota 





Recientes investigaciones han hecho salir a la luz una 


historia curiosa: parece claro que el inventor del telé- 
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Podéis encontrar la historia 
completa de este episodio 


en la siguiente dirección: 


AMA SA 
history/meucci_bell.html. 
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fono fue un italiano llamado Antonio Meucci, pero 
no patentó su invento porque no tenía suficiente di- 
nero para hacerlo. Bell se apropió del invento y lo 


patentó. 


Al principio, los pocos teléfonos que existían se utilizaban en entornos 
cerrados, particulares. Servían para interconectar dos espacios. A medi- 
da que el número de teléfonos instalados crecía, el interés por mantener 
múltiples comunicaciones también lo hacía: era preciso pensar en la 


manera de interconectarlos. Nacía la idea de red de comunicaciones. 


Una posible manera, bastante inmediata, de interconectar todos los 


aparatos sería lo que se puede observar en la figura siguiente: 





Figura 1. 











Es evidente que este modelo de conexión, “todos con todos”, es com- 
pletamente inviable: para cada aparato nuevo que se incorpora a la 
red, se precisa un gran número de conexiones nuevas. Para hacer- 
nos una idea, una red “todos con todos” de cincuenta teléfonos ne- 
cesita 1.225 líneas de conexión y, en cada teléfono, un dispositivo 


que permita cuarenta y nueve conexiones. 


Para solucionar este problema, aparecieron compañías que ofrecían 
un servicio de commutación: hacían llegar un cable hasta cada te- 
léfono y conectaban los cables de los teléfonos que deseaban esta- 
blecer una comunicación. De este modo, cada aparato disponía de 
una sola conexión y no era necesario establecer ninguna variación en 


la misma para incorporar nuevos aparatos a la red. 





| Figura 2. | 








De aqui provienen términos hoy tan comunes como abonado (el usuario 
que se abona a una central), bucle de abonado (el cable que une al 


abonado con la central) o central de conmutación. 


La tarea de conmutar las conexiones, al principio, se hacía a mano. 
Cuando alguien quería realizar una llamada, descolgaba y pedía a la 
operadora que le conectara con quien deseaba hablar. Una vez finali- 
zada la comunicación, la operadora desconectaba los cables y, así, las 


líneas quedaban preparadas para recibir otras llamadas. 


Las operadoras humanas fueron sustituidas progresivamente por inge- 
nios electromecánicos: las centralitas. Se incorporó a los teléfonos un 
disco con números para “marcar” el número del destinatario de la 
llamada. La centralita descodificaba este número para saber entre qué 


dos cables era preciso establecer la comunicación. 


Este servicio de conmutación empezó en el ámbito local: un barrio, un 
pueblo, una ciudad. El paso siguiente consistió en ofrecer conexiones a 
larga distancia, conectando centrales locales entre sí directamente, o 


por medio de centrales de tráfico. 





Figura 3. Comunicación entre dos centrales de conmutación 











PU Central A Central B 





Entre las dos centrales locales se establece un enlace con diferentes ca- 


bles independientes, de manera que los abonados de una de éstas 
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A.K. Erlang, ingeniero danés 
de principios del siglo xx, es- 
tableciéd los modelos moate- 
máticos que se utilizan para 
medir el trdfico telefénico. 


Se puede encontrar mucha 


información al respecto en 
la dirección siguiente: 


http://www.erlang.com 
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pueden, además de conectarse entre ellos, conectar con los abonados 
de la otra: se elige un cable de los que forman el enlace, se conecta 
con el abonado local y se pide a la otra central que conecte el enlace 


con el abonado destino, si no está ocupado con otra llamada. 


La conexión entre las dos centrales comporta un primer escollo impor- 


tante: es preciso decidir con cuántas líneas diferentes se llevará a cabo. 


Supongamos que la central A de la figura anterior proporciona servi- 
cio a cien abonados y la B, a doscientos cincuenta. Parece que, si se 
pretende dar el mejor servicio posible, se necesitan cien líneas para 
que todos los abonados de la central A puedan hablar de manera si- 


multánea con otros tantos de la central B. 


No obstante, la probabilidad de que todos los abonados de una cen- 
tral realicen una llamada al mismo momento es muy baja, puesto que 
las llamadas telefónicas son, en general, cortas y esporádicas. Por tan- 
to, es completamente innecesario que la conexión entre las dos cen- 
trales contemple todas las llamadas posibles: esta situación no se dará 


nunca y tiene un coste exagerado. 


Unos modelos matemáticos bastante complejos permiten calcular el 
número concreto de enlaces que se precisan a partir de la estadística 
de las llamadas que sirven las centrales (la frecuencia de aparición y 


su duración). 


Supongamos que en el ejemplo anterior estos modelos nos dan vein- 
ticinco enlaces. Si en un momento dado hay veinticinco llamadas en 
curso entre A y B y llega otra llamada, no tendrá ningún camino dis- 
ponible y, por consiguiente, no se podrá establecer. Esta situación se 
denomina bloqueo: el abonado a quien se quiere llamar no está ocu- 
pado; sin embargo, no se puede encontrar un camino libre por la red 


para establecer la comunicación. 


De esta situación se desprenden dos ideas fundamentales en re- 


lación con la red telefónica: 


e La conmutación de circuitos requiere pasar por tres fases para 


cada comunicación: 


— Establecimiento de llamada. Cuando se solicita iniciar una con- 


versación, es preciso averiguar si el destinatario está disponible y, 


en caso afirmativo, debe buscarse un camino libre en la red, que 
incluye conmutadores dentro de las centrales y enlaces entre las 


mismas. 


-— Comunicación. Una vez establecido el circuito, los interlocutores 


se intercambian información. 


— Liberación de recursos. Acabada la comunicación, se liberan los 
recursos utilizados (enlaces entre centrales y conmutadores dentro 


de las centrales). 


+ El hecho de que los recursos estén ocupados en exclusiva mientras 
dura la comunicación hace que las compañías que ofrecen el ser- 
vicio cobren según la duración de la llamada: se penaliza el uso 
extensivo de los recursos. De este modo, el usuario se apresura en 


acabar la comunicación y dejar los enlaces libres, disminuyendo 


así la probabilidad de bloqueo. 





Pronto, el sistema telefónico pasó a ser una cuestión nacional. Los 
estados desarrollaban sus redes según sus criterios y gustos. Se 
creó un organismo, el CCITT (Comité Consultivo Internacional de 
Telegrafía y Telefonía, Comité Consultatif International Télégraphique 
et Téléphonique), para armonizar los sistemas nacionales y permitir 
las comunicaciones entre países mediante centrales de tráfico inter- 


nacionales. 


Hemos comentado que entre las centrales existe una serie de lí- 
neas que permiten la conexión entre abonados de diferentes cen- 
trales. Al principio era realmente así: si se decidía que entre dos 
centrales era preciso disponer de cincuenta enlaces, se ponían 


cincuenta cables entre ellas. Sin embargo, con el progresivo aumento 
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El CCITT es un organismo in- 
ternacional patrocinado por 


las operadoras de telefonía, 
dedicado a tareas de norma- 
lización en el ámbito de las 
telecomunicaciones. El 1 de 
marzo de 1993 pasó a lla- 
marse ITU-T (International 
Telecommunication Union 
Standardisation Sector). 





Multiplexar significa hacer 
pasar diferentes comunica- 


ciones independientes por el 
mismo medio de transmi- 
sión. 
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de enlaces necesarios, este sistema pronto fue totalmente inviable 
y fue preciso recurrir a una técnica ya conocida en radiodifusión: 


la multiplexación. 


La técnica de multiplexación que se aplicó a la telefonía fue la mul- 
tiplexación en frecuencia: se modulan los diferentes canales de en- 
trada a distintas frecuencias portadoras, de manera que puedan 
viajar por el mismo medio sin interferirse. Se aplican filtros a la re- 


cepción que permiten separar los distintos canales multiplexados. 





Ejemplo 


Hacemos lo mismo al escuchar la radio o al ver la te- 
levisión. Hasta nuestra antena llegan todos los canales 
emitidos; con el dial y el selector de canales, respecti- 
vamente, seleccionamos el canal (la gama de frecuen- 
cias) correspondiente a la emisora que queremos 
recibir. Es decir, el dial o el selector de canales de la te- 
levisión constituyen los filtros que separan, en la recep- 


ción, los diferentes canales multiplexados. 





El número de canales diferentes que pueden viajar por un medio multi- 
plexado depende del ancho de banda de la señal y de la capacidad del 


medio. 


Por lo que respecta a la capacidad del medio, no posee la misma un 


par de hilos que un cable coaxial o que una fibra óptica. 


En cuanto al ancho de banda, en el caso de la voz, debería ser 
de 19.980 Hz (que es un ancho de banda considerable) puesto que 
el oído humano es capaz de distinguir frecuencias entre los 20 Hz y 
los 20.000 Hz. No obstante, a raíz de estudios que se llevaron a cabo 
sobre las características de la voz humana, se llegó a la conclusión 
de que con mucho menos bastaba, puesto que la inteligibilidad de la 
voz se concentra en una banda bastante estrecha, entre los 300 Hz y 
los 3.400 Hz. 


A partir de esta conclusión, se tomó una decisión que, a la larga, ha 
condicionado mucho el uso de la red telefónica: hacer el canal de voz 
de 4 kHz (entre 300 Hz y 3.400 Hz, más unas bandas laterales de 
guardia). 





Nota 





Haber reducido el canal de voz a 4 kHz explica por 
qué se escucha tan mal la música por el teléfono: no 
hay ni graves ni agudos, sólo hay las frecuencias del 


medio. 


A partir de aquí, se estandarizaron los diferentes niveles de mul- 
tiplexación. El nivel básico es la agrupación de distintos canales 
de 4 kHz, el siguiente es una agrupación de multiplexados bási- 


cos, etc. 





Nota 





La jerarquía que propuso la compañía americana AT&T, 


y que ha acabado estandarizándose, es la siguiente: 





| Tabla 1. | 





Ancho Canales 
Nombre de banda de voz 


Group 60-108 kHz 48 kHz 





Supergroup 312-552 kHz 240 kHz 





Mastergroup | 564-3.084 kHz 2,52 MHz 





Jumbogroup | 0,5-17,5 MHz 17 MHz 




















A la entrada de la central local se encuentra un filtro que elimina 
cualquier frecuencia por encima de los 4 kHz. La señal de salida 
de este Ultimo es la que se multiplexa, conmuta y lleva hasta el 


destinatario. 





Figura 4. 
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Al decir que eran máquinas 
poco potentes, evidentemen- 
te, es comparádolos con los 
actuales. Para la época, eran 
unas máquinas fantásticas. 


A los terminales pasivos, que 
coloquialmente se llaman ter- 
minales tontos, en inglés se les 
conoce como dumb terminal 
(‘terminal mudo’). 
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Con todo ello, ya podemos dibujar un panorama completo de la 


red telefónica, tal como era hasta los años setenta: 





| 1.2. Aparecen los primeros ordenadores 


La década de los sesenta vio la aparición de los primeros ordena- 
dores comerciales. Eran grandes, caros y poco potentes. Sólo or- 
ganismos oficiales, grandes empresas o universidades podían 
comprarlo, y lo que es más normal es que sólo compraran uno (o 
algunos, pero no uno para cada usuario, como hoy día estamos 


acostumbrados a ver). 


Por ello, estos ordenadores llevaban sistemas operativos multita- 
rea y multiusuario, para que diferentes usuarios, realizando dis- 
tintos trabajos, pudieran utilizarlos simultáneamente. El acceso a 
dichos ordenadores se llevaba a cabo por medio de terminales sin 


ninguna capacidad de proceso, pasivos: 





Figura 5. 








! ; Ordenador central i : 
Terminal pasivo Terminal pasivo 


Instrucciones Instrucciones 


Resultados Resultados 





1.2.1. Los módems 


No tardó mucho en aparecer la necesidad de poder alejar los termi- 
nales de la unidad central para conectarse, por ejemplo, desde casa 


o desde una delegación al ordenador central. 


Para poder realizar este acceso remoto, la primera solución que apor- 
taron los ingenieros informáticos de la época fue utilizar la red telefónica 
que, por su ubicuidad, les ahorraba generar infraestructuras nuevas. 
Sólo se precisaba un aparato que adaptara los bits a la red (recordad 
que la red telefónica sólo deja pasar sonidos entre unos márgenes de 


frecuencia). Estos aparatos son los módems. 





Figura 6. 








Los primeros módems eran de 300 bps y generaban dos tonos di- 
ferentes: uno para el 1 lógico y otro para el O. En la actualidad, 
van a 56.000 bps, que es el máximo que permite la red telefónica 


convencional actual. 
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Módem es un acrónimo de 
modulator-demodulator, que 
se refiere a su función: modu- 


lar (generar señales audibles 
según los valores de los bits) 
y demodular (generar bits a 
partir de las señales que reci- 
be de la red telefénica). 
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Los módems no sólo servían para poder alejar los terminales pa- 
sivos de los ordenadores centrales, también permitían interconec- 


tar ordenadores entre sí. 








Figura 7. 








¡Esto ya es una red de computadores! 


La tecnología de conmutación de circuitos se desarrolló en un origen 
para las comunicaciones telefónicas y una de sus características fun- 
damentales era la ocupación en exclusiva de los recursos mientras 
duraba la conexión, lo que (como ya hemos visto) justificaba la tari- 
fación por tiempo. Sin embargo, las comunicaciones informáticas no 
son cortas, intensas y esporádicas como las de voz. Al conectar un ter- 
minal a un ordenador central por medio de dos módems, no están pa- 
sando datos todo el tiempo que dura la conexión: puede haber 
largos periodos de tiempo en los que no pase ningún bit y momentos 
en los que haya un intercambio de datos intenso, aunque a una ve- 
locidad de transmisión mucho más baja que la que se puede man- 
tener entre el terminal y el ordenador conectados directamente. Las 
facturas telefónicas empezaron a ser astronómicas, y desproporcio- 


nadas, respecto del uso real de la red. 


1.2.2. Las redes de datos 


Pronto las grandes empresas presionaron a las compañías telefóni- 
cas del momento para que desarrollaran redes pensadas para trans- 


portar datos, cuyo sistema de tarifación se ajustara al tráfico de datos 


real y permitiera más velocidad que los escasos 300 o 1.200 bps que 
se lograban utilizando la red telefónica. La respuesta fueron las re- 


des de conmutación de paquetes. 


El envío de datos no necesariamente debe llevarse a cabo en tiempo 
real (las transmisiones de voz, sí). Por tanto, no es preciso establecer 
el camino entre los dos puntos antes de empezar la transmisión y 
mantenerlo mientras dura el intercambio de datos. En lugar de ello, 
se empaquetan los bits que deben transmitirse y se dan a la central 
más próxima para que los envíe cuando pueda a la siguiente, y así 
sucesivamente hasta que lleguen al destino. Si cuando un paquete 
llega a una central todos los enlaces con la siguiente están ocupados, 
no pasa nada, lo hace esperar poniéndolo en una cola para enviarlo 


cuando haya un enlace disponible. 





Existe otro peligro: los paquetes pueden perderse. Conviene tener 
presente que las colas son limitadas y, si llega un paquete cuando 
una ya está llena, no se podrá guardar y se perderá. Es preciso pre- 
ver mecanismos que eviten dichas pérdidas y regulen el flujo de in- 


formación entre los nodos de conmutación. 


Las compañías telefónicas desarrollaron redes de este tipo, y el 
CCITT emitió un estándar, el X.25, que es el que se ha adoptado has- 


ta hace muy poco. 
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En España, la red de datos 
se llamaba Iberpac. 


En la actualidad, para co- 
municaciones de datos se 
utiliza Frame Relay, la evo- 
lucién natural de X.25. 





Con frecuencia se utiliza la 
sigla inglesa LAN (local 
area network) para identifi- 
car las redes de área local, 
y la sigla WAN (wide area 
network) para identificar las 


redes de gran alcance. 
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1.2.3. Las redes de área local 


Cuando empezó a ser habitual disponer de más de un ordenador 
en la misma instalación, apareció la necesidad de interconectar- 
los para poder compartir los diferentes recursos: dispositivos caros, 
tales como impresoras de calidad, un disco duro que almacenara 
los datos de la empresa, un equipo de cinta para realizar copias 


de seguridad, etc. 


El diseño de las redes de área local siguió caminos completamente 
diferentes de los que se siguieron para las redes de gran alcance. En 
las redes de área local se necesita, habitualmente, establecer comu- 
nicaciones “muchos a uno” y “uno a muchos”, lo que es difícil de con- 
seguir con las redes de conmutación, pensadas para interconectar 
dos estaciones. Para este tipo de redes es más adecuada la difusión 
con medio compartido, en que los paquetes que salen de una esta- 
ción llegan a todo el resto simultáneamente. En la recepción, las es- 
taciones los aceptan o ignoran dependiendo de si son destinatarias 


delos mismos o no. 





| 1.3. Arquitecturas de protocolos 


De la década de los sesenta datan también los primeros estánda- 
res de arquitecturas de protocolos. Conviene tener presente que 
el intercambio de información entre ordenadores tiene toda una 


serie de implicaciones, entre las que se encuentran las siguientes: 


e Aspectos eléctricos: los cables, los conectores, las señales, etc. 


¢ La manera de agrupar los bits para formar paquetes y la de con- 


trolar que no se produzcan errores de transmisión. 


e La identificación de los ordenadores dentro de la red y la manera 
de conseguir que la información que genera un ordenador llegue 


a quien se pretende. 


Atacar todos estos aspectos de una manera global no es viable: dema- 
siadas cosas y demasiado diferentes entre sí. Por ello, ya desde el prin- 
cipio, se desarrollaron modelos estructurados en niveles: en cada nivel 
se lleva a cabo una tarea y la cooperación de todos los niveles propor- 


ciona la conectividad deseada por los usuarios. 


Conviene considerar que, en la época que nos ocupa, la informática es- 
taba en manos de muy pocos fabricantes e imperaba la filosofía del ser- 
vicio integral: cada fabricante lo proporcionaba todo (ordenadores, 
cables, periféricos, sistema operativo y software). Por tanto, cuando 
una empresa se queria informatizar, elegía una marca y quedaba 


vinculada a la misma para toda la vida. 





Nota 





Hablamos de empresas como IBM (International Business 
Machines) o DEC (Digital Equipment Corporation). 
Cuando estas empresaas se propusieron ofrecer co- 
nectividad entre sus equipos, local o remota, también 
lo hicieron aplicando la filosofía de la separación por 
niveles: IBM desarrolló la arquitectura SNA (system 
network arquitecture) y DEC, la DNA (DEC network 
arquitecture). Eran dos modelos completos, estructu- 
rados en niveles, pero incompatibles entre sí, según la 


filosofía de la informática propietaria. 








En la década de los setenta el panorama cambió radicalmente, so- 


bre todo a causa de tres acontecimientos: 
e La propuesta del protocolo Ethernet para redes locales. 


e La aparición del sistema operativo Unix, que no estaba vinculado 
a ninguna marca comercial, compatible con todas las platafor- 


mas de hardware existentes. 


e La invención de los protocolos TCP/IP, embrión de la actual Internet. 


Se había allanado el camino para la aparición de los sistemas abier- 


tos: no era preciso vincularse a ninguna marca para tenerlo todo. El 
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TCP/IP son las siglas de 
transmission control protocol/ 


Internet protocol (protocolo 
de control de transmisién/ 
protocolo de Internet). 
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hardware podia ser de un proveedor, el sistema operativo de otro, 


las aplicaciones de otro y los protocolos, públicos. 


TCP/IP nació a partir de un encargo de la DARPA a la comunidad 
científica americana para obtener una red mundial que fuera recon- 
figurable con facilidad y de forma automática en caso de destrucción 


de algún nodo o de algún enlace. 


La pila TCP/IP era una jerarquía de protocolos que ofrecía conectivi- 
dad y, a pesar de tener poco que ver con las que ya existían, consti- 
tuía una opción más en el mercado. Ante una oferta tan grande y 
dispar de protocolos, la ISO (Organización Internacional de Estan- 
darización, International Organization for Standardization) y el 
CCITT propusieron un nuevo modelo que intentaba reunir de algún 
modo todo lo que ya se había propuesto y que pretendía ser comple- 
to, racional y muy bien estructurado (la TCP/IP tiene fama de ser una 
pila de protocolos andrquica), con la intención, por tanto, de que se 
convirtiera en un modelo de referencia. Es la conocida como pila de 


protocolos OSI (open systems interconnection). 





Sin embargo, el origen universitario de la Red ha marcado su evo- 
lución en muchos sentidos. Por ejemplo, el modelo cliente/servidor 
de aplicaciones distribuidas. Es un modelo sencillo y, al mismo 
tiempo, potente, y casi todas las aplicaciones que se utilizan en In- 
ternet lo siguen. El Telnet, o apertura de sesión remota, la trans- 
ferencia de ficheros (FTP), el correo electrónico y, sobre todo, el 
WWW (World Wide Web) constituyen ejemplos claros de aplica- 
ciones que siguen este modelo. Las dos primeras han caído un 


poco en desuso, pero tanto el correo como el WWW son las ac- 


tuales estrellas en Internet. Timidamente, aparecen nuevas pro- 
puestas de aplicaciones; sin embargo, el WWW, que nació como 
un servicio de páginas estáticas enlazadas con hiperenlaces, se 
está convirtiendo en la interfaz de usuario de toda la Red, puesto 
que en la actualidad se utiliza para servir páginas dinámicas (se 
crean en el momento en que se sirven), e, incluso, código que se 


ejecuta en el ordenador cliente (applets). 





1.4. La digitalización de la red telefónica 


En este momento tenemos dos redes completamente independientes 


entre sí, pero de alguna manera superpuestas: 


* Una red analógica, con conmutación de circuitos, pensada para voz. 


* Una red digital, con conmutación de paquetes, pensada para datos. 


La red telefónica, tal como la hemos descrito hasta ahora, es com- 
pletamente analógica: la señal electromagnética que viaja desde 
un teléfono hasta otro es analógica (varía continuamente y en 
cualquier momento puede adoptar cualquier valor) y los circuitos 


electrónicos que componen la red también lo son. 


Los enlaces entre centrales de la red telefónica se llevaban a cabo 
con señales analógicas con muchos canales multiplexados en fre- 
cuencia y, en ocasiones, debían recorrer grandes distancias. La 
atenuación de la señal inherente a la distancia que era preciso re- 
correr debía corregirse por medio de repetidores que la amplificaban, 
lo que aumentaba el ruido presente en la línea. A menudo, la señal re- 
cibida era de una calidad muy baja porque la transmisión analógica 
no permite eliminar el ruido y las interferencias en la recepción. 
No hay manera de saber con exactitud qué se ha enviado desde el 


origen y qué es ruido añadido. 


En 1972, se hicieron públicos los primeros resultados del trata- 
miento digital de la señal aplicado a audio, básicamente orienta- 
do a su almacenamiento. El CD estaba viendo la luz. Convertir un 
sonido (una magnitud física que puede adoptar cualquier valor en 
cualquier momento) en una serie de O y 1 (dos únicos valores, co- 


nocidos) permitía corregir con facilidad cualquier ruido añadido. 
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Figura 8. 











En el caso de la señal analógica, viendo la señal recibida, no se puede deducir cuál ha 
sido la señal emitida. En cambio, en el caso de la señal digital, como se conocen los va- 
lores enviados, se establece un umbral en el punto medio entre los dos valores y se decide 
que todo lo que esté por encima corresponde a un 1 y todo lo que esté por debajo, a un O. 
Si el ruido que se ha añadido es superior a la diferencia entre el valor original y el umbral, 
se produce un error de recepción: se decide que se había enviado el valor equivocado. 
Las técnicas para luchar contra este tipo de errores se verán más adelante. 








El descubrimiento del procesado digital de la señal, así como sus 
aplicaciones en los campos del sonido y la imagen, ha constituido un 
hito capital en el mundo de las comunicaciones. Básicamente, ha 
permitido reducir drásticamente el efecto del ruido, lo que ha posibi- 
litado, por un lado, incrementar la calidad de recepción de las seña- 
les y, por el otro, aumentar la velocidad de transmisión con los 


mismos medios. 


Las compañías telefónicas empezaron a sustituir los enlaces internos 
(entre centrales) por señales digitales, pero manteniendo el bucle de 
abonado (línea y terminal) analógico. La digitalización de la señal 
de sonido se lleva a cabo dentro de la central local, después del 
filtro de 4 kHz, y se vuelve a pasar a analógica en la central correspon- 
diente al otro extremo de la comunicación. La digitalización ha hecho 
cambiar sustancialmente los procesos de commutación: ahora debe tra- 
bajarse con bits y, por tanto, las centrales electromecánicas deben sus- 


tituirse por ordenadores. 





1.4.1. La red digital de servicios integrados 


Una vez digitalizada la red telefónica, el paso siguiente debía ser 
llevar la transmisión de bits hasta las casas. Ello permitía, por un 
lado, ofrecer a los usuarios en su casa la transmisión de datos 
además de la tradicional de voz y, por otro, ofrecer a los abona- 
dos un abanico de nuevos servicios asociados a una comunica- 
ción enteramente digital de extremo a extremo. Este servicio de 
transmisión digital por medio de la red telefónica se conoce como 
red digital de servicios integrados (RDSI). Ofrece dos canales inde- 
pendientes de 64 kbps, que permiten hablar y conectarse a Internet 
simultáneamente, o, con el hardware adecuado, aprovechar los dos 


canales juntos para navegar a 128 kbps. 


| 1.5. La banda ancha 


El uso de la red telefónica para transmitir datos tiene una limitación im- 
portante por lo que respecta al máximo de bits por segundo permitidos 
y las redes específicas de datos son muy caras para el uso doméstico. 
Desde la década de los noventa, se han estudiado maneras de llevar 
hasta las casas o las empresas un buen caudal de bits por segundo 
(banda ancha) a un precio razonable, de manera que las nuevas apli- 


caciones multimedia se puedan explotar al máximo. 


Para conseguir esta banda ancha, se han seguido dos caminos comple- 


tamente diferentes: 


+ Se han promovido cableados nuevos con fibra óptica que permitan 
este gran caudal, con frecuencia implementados por empresas con 
afán competidor contra los monopolios dominantes. Estas redes se 
aprovechan para proporcionar un servicio integral: televisión, teléfo- 


no y datos. 


e Las compañías telefónicas de toda la vida han querido sacar partido 
del cableado que ya tienen hecho y, por ello, se han desarrollado las 
tecnologías ADSL, que permiten la convivencia en el bucle de abo- 


nado de la señal telefónica y una señal de datos que puede llegar a 
los 8 Mbps. 
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La red digital de servicios in- 
tegrados (RDSI) corresponde 


a las siglas en inglés ISDN 
(integrated services digital 
network). 
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Nota 





La frontera entre banda estrecha y banda ancha no 
está muy clara. Los 128 kbps de la RDSI se consideran 
banda estrecha y, hay quien califica de banda ancha 
a los 256 kbps de la ADSL básica. 


Realmente, se considera banda ancha a partir de 1 Mbps. 


| 1.6. La telefonía móvil 


La telefonía móvil, todo un fenómeno sociológico de finales del si- 
glo xx, ha vivido una evolución fulgurante: en menos de veinte años, 
ha pasado de la nada a constituir una tecnología de uso diario para 


más de un 70% de la población. 


Desde el punto de vista de sistema de comunicación, debemos ver 


los móviles como una extensión de la red telefónica convencional. 








Figura 9. | 








El sistema GSM, que constituye el actual estándar europeo, permite 


el acceso a la red de voz, cambiando el bucle de abonado: en lugar 
de ser un cable, es un enlace radioeléctrico entre una antena y el mó- 
vil. Se trata, por tanto, de una red de conmutación de circuitos y se 


continúa fijando la tarifa por tiempo de conexión. 


El estándar GPRS permite el transporte de bits, pagando por tráfico 
en lugar de por tiempo. Por tanto, es aproximadamente el clónico de 


las redes de datos con hilos. 


El estándar UMTS, en la actualidad todavia en la fase previa a su lan- 
zamiento comercial, permite transferencias del orden de megabits 
por segundo, necesarias para disponer de aplicaciones multimedia 


en el móvil. Sin embargo, requiere nuevas antenas y terminales. 
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| 2. Arquitecturas de protocolos: el modelo OSI 


Como ya hemos comentado, cuando el CCITT y la ISO propusieron 
la torre OSI, en el mercado había muchas arquitecturas de protoco- 
los, unas propietarias, otras abiertas, pero todas diferentes. La torre 
OSI pretendía ser un modelo básico de referencia, un marco para el 
desarrollo de estándares que permitieran la interoperabilidad com- 
pleta. Diferentes razones han hecho que este modelo, así como las 
normas que del mismo se derivan, no hayan tenido la repercusión que 


se esperaba, entre las que destacan las siguientes: 


e La complejidad del modelo, innecesaria en muchos casos. 
e La complejidad de las normas desarrolladas a partir del modelo. 


+ El impulso del modelo Internet y la simplicidad de sus estándares. 


A pesar de que el modelo OSI no se haya impuesto en los desarro- 
llos, es muy útil como referencia para explicar qué debe hacerse y có- 
mo. El hecho de que sea tan completo y cartesiano lo hace muy 
interesante para la pedagogía de los conceptos básicos de redes, y 
las arquitecturas que en realidad se utilizan se explican estableciendo 
una relación constante con el modelo OSI. Por ello, en este apartado 
explicamos los siete niveles de la torre OSI. A partir del módulo si- 
guiente, sin embargo, nos centraremos en la arquitectura TCP/IP, la 


que constituye la Red Internet. 


| 2.1. Definición 
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| Figura 10. | 
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Los niveles de la torre se comunican en dos direcciones: 


e Horizontal. La comunicación horizontal sólo se da entre niveles ho- 
mónimos. Se podría pensar —y de hecho es asi— que todo el nivel 
constituye un Único sistema distribuido que tiene un representante en 
cada uno de los equipos. Un protocolo de nivel i (en el que i es el 
identificador del nivel correspondiente) especifica el formato, el sig- 
nificado y la temporización de la información que circula entre los 


miembros de este sistema distribuido. 


e Vertical. La comunicación vertical sólo se da entre niveles adyacentes 
de un mismo sistema. Este tipo de comunicación posee un carácter 
totalmente local; es decir, puede materializarse por mecanismos de 
software (llamadas a liberías, comunicación entre procesos, etc.). De 
manera genérica, denominaremos estos mecanismos servicio de ni- 
vel i (en el que i es el identificador del nivel que proporciona el ser- 


vicio, ei + 1, el nivel que lo utiliza). 


| 2.2. Los protocolos 


Con los protocolos se pretende la intercomunicación de entidades si- 
tuadas en diferentes máquinas. Entendemos por entidad un sistema 


electrónico y/o informático, ubicado dentro de un nivel del modelo OSI, 


que, en combinación con las otras entidades del mismo nivel situa- 


das en otros sistemas, forma un todo (un sistema distribuido). 


Por tanto, la especificación del protocolo que utilizamos debe llevar- 
se a cabo en un estándar claramente definido que permita a desarro- 
lladores que no trabajan juntos implementarlo de manera totalmente 


idéntica. 


La recepción de una secuencia de bits en un momento inesperado o 
de una longitud incorrecta, o en una disposición imprevista, puede 
hacer que la entidad destinataria no reaccione correctamente y deje 
de inmediato el nivel (las dos entidades que lo forman) en una situa- 


ción inestable. 


Evidentemente, esta situción no se puede permitir. Por ello, la imple- 
mentación del protocolo debe ser extremamente esmerada y, por 


consiguiente, también la especificación del estándar. 











Figura 11. 
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En terminologia OSI se sue- 


le decir que los servicios no 
se especifican, sino que se 
describen. 





42 





| 2.3. Los servicios 


La especificación de un servicio es siempre menos estricta que la de 
un protocolo. Por servicio entendemos la comunicación que se pro- 
duce dentro de una misma máquina y, por consiguiente, dentro de 
un único ámbito de responsabilidad. La funcionalidad de las interfa- 
ces de cada uno de los niveles (y, por tanto, de las entidades que la 
implementan), la determinarán los estándares que utilicen; sin em- 
bargo, su especificación precisa no es relevante para los estándares 
involucrados. Cada sistema individual puede materializarlas de una 


manera u otra segun convenga. 


Sea como sea, la cantidad de papel que ocupa la descripción de un 
servicio siempre será muy inferior a la que ocupa la especificación de 


un protocolo. 





Figura 12. 
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Actividad 


Comentad las diferencias existentes entre protocolo y 


servicio. 


| 2.4. Los siete niveles del modelo OSI 


2.4.1. Nivel físico 


El nivel físico se encarga de las tareas de transmisión física de las se- 
ñales eléctricas (o electromagnéticas) entre los diferentes sistemas. 
Las limitaciones del nivel físico (equipos de transmisión y recepción, 
medios de transmisión, amplificadores, etc.) imponen otras al resto 
del sistema: por un lado, limitan la velocidad de transmisión (en bits 
por segundo) y, por otro, hacen aparecer una probabilidad de 


error, el porcentaje de bits erróneos que llegan a destino. 


La primera limitación es casi insalvable partiendo de un medio de 
transmisión dado, puesto que los parámetros físicos de este último 
imponen un límite superior no superable por medio de una mejora 
tecnológica. Los medios de transmisión poseen una capacidad de 
transmisión acotada y la electrónica que utilizamos para llevar a 
cabo las transmisiones puede mejorar la velocidad de transmisión, 
pero no superar este límite. Esta limitación viene dada por el ancho 
de banda, o anchura del espectro eléctrico, que puede atravesar el 
medio de transmisión (doblar el ancho de banda significa que se 
puede doblar la velocidad de transmisión) y por la imposibilidad 


práctica de recibir la señal libre de cualquier interferencia. 


2.4.2. Nivel de enlace 


El nivel de enlace es el primero de la torre OSI que se basa en software, 
algoritmos y protocolos. Su misión principal es dar fiabilidad a la 
transmisión de las señales eléctricas o electromagnéticas que pro- 
porciona el nivel físico, lo que se puede conseguir si las cotas de error 
son inferiores al 1%. Se añaden bits adicionales a los que forman el 
mensaje para poder detectar errores de transmisión y pedir su re- 
transmisión. Para ello, es preciso conferir una estructura a los bits: se 
agrupan en pequeños bloques denominados tramas, que contienen 
los bits de mensaje, los bits añadidos para detectar errores y diferen- 


tes campos de control, tales como el número de trama. 


El transmisor calcula estos bits adicionales a partir del resto por me- 


dio de una operación que el receptor conoce y aplica igualmente. Si 
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En el nivel físico somos inca- 


paces de corregir errores. 


Asumimos una probabilidad 
de error y encargamos al nivel 
superior su correccion. 





El hecho de que las tramas 
sean pequeños bloques de 
bits minimiza la probabili- 


dad de que haya muchos 


bits erréneos dentro de los 
bloques. 
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el receptor detecta una discrepancia entre los bits adicionales (redun- 
dantes) y los que ha calculado a partir del resto, detecta que el blo- 


que es erróneo y pedirá su retransmisión. 





Además del control de errores, el nivel de enlace lleva a cabo otra 


tarea importante: el control de flujo. 


El receptor debe procesar las tramas a medida que las recibe. En al- 
gunos casos, este proceso comporta un gasto de tiempo mínimo, te- 
niendo en cuenta la velocidad de transmisión (por ejemplo, guardar 
los datos en disco); sin embargo, puede haber casos en que este pro- 
ceso sea costoso. En esta situación, el receptor necesita un mecanis- 
mo que notifique al transmisor que debe detener momentáneamente 
la transmisión con el objetivo de disponer del tiempo necesario para 


llevar a cabo esta tarea. 


El nivel de enlace no sólo sirve para controlar líneas punto a punto, 
sino también para controlar líneas compartidas por diferentes termi- 


nales (redes de área local). 


2.4.3. Nivel de red 


El nivel de red es el que permite que pueda haber más de dos má- 
quinas involucradas en las inerconexiones. Si sólo se tuviese el nivel 
de enlace, esto no sería posible. El nivel de enlace se ocupa de que 
los bits lleguen de una lado a otro, por lo tanto, sólo permite inter- 
conectar dos máquinas. Para poder interconectar más de dos máqui- 
nas, necesitamos identificarlas y conectarlas de alguna manera. Ésta 


es la tarea del nivel de red. 


Ya hemos visto que las redes de conmutación de paquetes constitu- 


yen el tipo de red más eficiente para transmitir datos desde diferentes 


puntos de vista: uso de recursos, coste, capacidad de mantener dis- 
tintas conexiones simultáneas, etc. El modelo OSI, por tanto, sólo ha- 


bla de redes de conmutación de paquetes. 


En el nivel de red se distingue entre estaciones terminales y nodos de 


conmutación: 











Red de 
conmutacion 


m Estacién 
® Nodo 








La palabra red proviene de esta imagen: los enlaces 
son los cordeles que unen los nudos o sistemas. 





Los nodos de conmutación disponen de diferentes enlaces hacia 
otros nodos o hacia terminales, y son los que permiten que los pa- 


quetes viajen por la red desde una estación terminal a otra. 


Existen dos tipos de redes de conmutación de paquetes: 


e Redes que funcionan en modo datagrama. Podríamos decir que 
este tipo de redes son las básicas, puesto que incorporan la funcio- 
nalidad mínima para que un grupo de nodos y de terminales inter- 


conectados puedan hacer pasar información de un punto a otro. 


El problema de las redes en modo datagrama radica en la dificul- 
tad de garantizar la entrega correcta y completa de la información, 
puesto que los diferentes paquetes que forman la transmisión no 
mantienen un vínculo conocido por la red. Los paquetes pueden 


llegar fuera de orden, duplicados, o incluso se pueden perder sin 
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que la red pueda hacer gran cosa al respecto. Se deja al terminal 
receptor la responsabilidad de restaurar los posibles daños que 


haya tenido el paquete durante la transmisión. 


e Redes que funcionan en modo circuito virtual. Estas redes pueden 
garantizar que la entrega de los paquetes sea correcta y comple- 
ta, y lo hacen aportando el concepto de conexión propio de las 
redes de conmutación de circuitos. Es el circuito virtual. Este último 
permite agrupar los paquetes relacionados de manera que el re- 
ceptor los recibe correctamente sin problemas de orden, duplica- 


ción o pérdida. 


La asignación de direcciones es uno de los conceptos básicos del nivel 
de red. Le permite, como sistema distribuido pero único, decidir cuál de 


los múltiples terminales es el destinatario final de cada paquete. 


El direccionamiento constituye el procedimiento que permite a este 
sistema distribuido conducir la información por los diferentes nodos 
de origen a destino, minimizando el trayecto y el tiempo de tránsito, 


optimizando recursos, etc. 


2.4.4. Nivel de transporte 


El nivel de transporte permite una conexión fiable sobre cualquier 
tipo de red (fiable o no). En las redes de conmutación de paquetes 
en modo datagrama es donde este nivel revela su importancia, pues- 
to que es el responsable de controlar las posibles deficiencias de las 


transmisiones. 


La función principal de este nivel consiste en asegurar la calidad de 
transmisión entre los terminales que utilizan la red, lo que implica re- 
cuperar errores, ordenar correctamente la información, ajustar la ve- 


locidad de transmisión de la información (control de flujo), etc. 


2.4.5. Niveles de sesión, presentación y aplicación 


Estos tres niveles se suelen explicar de manera conjunta, puesto que 
existen pocos ejemplos prácticos de protocolos de sesión y de pre- 


sentación. Además, la arquitectura Internet delega todos los trabajos 


por encima de transporte a la aplicación. No obstante, en el modelo 
OSI están definidos como tres niveles diferentes e independientes, con 


atribuciones propias. 


El nivel de sesión es, en teoría, el encargado de gestionar las co- 
nexiones de larga duración, la recuperación de caídas de red de ma- 


nera transparente y los protocolos de sincronía entre aplicaciones. 


El nivel de presentación se encarga de conseguir que las diferentes 
plataformas (sistemas operativos, procesadores, etc.) se puedan en- 
tender al conectarse por medio de una misma red. Dicho de otra 
manera, soluciona el problema de la hetereogeneidad definiendo 
una manera universal de codificar la información. Dicha codificación 
puede tener propiedades de eficiencia (por medio de la compresión, 
por ejemplo), propiedades de confidencialidad (por medio de la crip- 


tografía), etc. 


En el nivel de aplicación residen los programas. En este nivel pode- 
mos encontrar servidores, clientes que acceden a estos últimos, apli- 


caciones que trabajan según un modelo simétrico (peer-to-peer), etc. 





Actividad 


Asignad los diferentes niveles de las redes que cono- 


céis a las funciones explicadas en este apartado. 
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| Il. Redes de área local 


| 3. Las redes de área local 


Una red de área local es un sistema que permite la interconexión de 
ordenadores que están próximos físicamente. Entendemos por próxi- 
mo todo lo que no sea cruzar una vía pública: una habitación, un 


edificio, un campus universitario, etc. 


En el momento en que una red debe cruzar una calle, o una vía pública 
en general, es preciso que una compañía de telecomunicaciones esta- 
blezca la comunicación, puesto que son las Únicas autorizadas para pa- 


sar líneas por zonas públicas. 





Como comentábamos en la primera unidad, el objetivo que se perse- 
guía cuando se propusieron las primeras redes de área local era com- 
partir recursos entre diferentes ordenadores próximos (un sistema de 
almacenamiento masivo, una impresora o un dispositivo de conexión 
hacia el exterior, por ejemplo). Para este tipo de comunicaciones se pro- 
puso una filosofía de diseño basada en la difusión de tramas con medio 
compartido, de manera que cuando una estación pone una trama en el 
medio, el resto de estaciones puedan recibirla. Los receptores reales de 


la trama se la quedan y el resto, la ignora. 





Nota 





Las primeras redes de área local sólo permitían que uno de 
los ordenadores de la red (el servidor) ofreciera recursos al 
resto, que sólo podían actuar como clientes de este servi- 
dor, sin capacidad de ofrecer nada. De un tiempo a esta par- 
te, el software de red que elaboran empresas como Novell, 
Microsoft o Apple permite que todas las estaciones puedan 
actuar como servidores y clientes al mismo tiempo. 





51 


Los niveles red, transporte, 
sesion y presentacién tienen 


sentido en redes de área ex- 
tensa, como veremos en las 
unidades siguientes. 
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Ultimamente y como veremos más adelante, se han aplicado técnicas 
de conmutación a las redes de área local, para conseguir mejorar su 


rendimiento. 


Otra mejora importante ha sido la aparición de las redes de área local 
inalámbricas (wireless LAN), en las que el enlace entre estaciones no se 
lleva a cabo por medio de cables, sino por medio de enlaces radioeléc- 
tricos. Las ventajas de este tipo de enlaces, en cuanto a movilidad y fa- 


cilidad de instalación, son evidentes. 


En una red es imprescindible identificar los ordenadores que forman 
parte de la misma. Cuando un ordenador genera una trama para otro, 
además de los datos que le quiere enviar, le pone el identificador del 
ordenador (u ordenadores) destino y el suyo, para que quien reciba la 


trama pueda saber quién se la ha enviado. 


Para construir una red local, se precisan básicamente dos cosas: 
hardware (tarjetas, cables, conectores) y un sofware que sea consciente 
de que existen diferentes máquinas conectadas y ofrezca los servicios ne- 
cesarios para que las aplicaciones puedan aprovecharlo. Lo más lógico 
es que este software se integre en el sistema operativo y ofrezca a las apli- 
caciones la visión de la red como un recurso propio más. Estos recursos 
de hardware y software necesarios pueden ser analizados desde el punto 


de vista de la torre OSI, como se explicaba en la unidad anterior: 





Figura 14. 














Como se puede ver en la figura anterior, los niveles necesarios para im- 
plementar una red de área local son los dos inferiores (físico y enlace) y 
el superior (aplicación). A nivel de usuario no somos conscientes de esta 
subdivisión porque, como hemos dicho, el código que implementa los 
servicios asociados a los niveles está integrado en el sistema operativo 


de las estaciones. 


El nivel físico corresponde al hardware: a la tarjeta de red, a las señales 
electromagnéticas que viajan por el medio de transmisión, a los dispo- 


sitivos que generan estas señales a partir de bits, etc. 


El nivel de enlace, como ya sabemos, proporciona fiabilidad en el 
intercambio de tramas entre las estaciones: básicamente control de 
errores y control de flujo. Pero, por el hecho de usar un medio com- 
partido, será necesario establecer mecanismos para que todas las 
estaciones puedan usarlo cuando lo precisen, pero sin molestarse. 
Si dos estaciones ponen tramas en el medio de transmisión de for- 
ma simultánea, éstas se mezclarán de manera que se convertirán 
en algo ininteligible. Esta situación se conoce como colisión de tra- 
mas y necesitamos mecanismos para controlar el acceso al medio 
compartido de manera que no se produzcan, o que si se producen, 


la red pueda recuperarse y seguir funcionando. 


La inclusión de estos mecanismos en la torre OSI se podía llevar a cabo 
añadiendo un nivel más a la torre o, cómo al final sucedió, incluyéndo- 
los en el nivel de enlace. Así, en contextos de área local, el nivel de en- 


lace incluye dos subniveles: 


+ MAC (medium access control o control de acceso al medio), que 


se encarga própiamente de la política de acceso al medio 


e LLC (logical link control o control del enlace lógico), que se en- 
carga de los servicios típicos de enlace: control de errores y 


control de flujo. 





Figura 15. 
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| 4. Topologias de las LAN 


Lo primero que caracteriza una red local es la manera en que se 
conectan las estaciones; es decir, la forma que adopta el medio 
compartido entre las mismas. Bdsicamente existen tres topologias 


posibles: 


+ Topología en estrella. 
e Topología en bus. 


e Topología en anillo. 


| 4.1. Topología en estrella 


La topología en estrella consiste en conectar cada ordenador a un 
punto central, que puede ser tan sencillo como una simple unión fí- 


sica de los cables. 


Cuando un ordenador pone una trama en la red, ésta aparece de 


inmediato en las entradas del resto de ordenadores. 





Figura 16. 











Sa 





Aunque se han definido estándares para este tipo de redes, en la ac- 
tualidad ya casi no existen, puesto que no aportan ninguna ventaja 


sobre el resto y sí muchos inconvenientes. 
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| 4.2. Topología en bus 


La topología en bus consiste en un cable al que se unen todas las es- 


taciones de la red. 





Figura 17. 











Todos los ordenadores están pendientes de si hay actividad en el ca- 
ble. En el momento en que un ordenador pone una trama, todos los 
ordenadores la cogen y miran si son el destinatario de la misma. Si 


es así, se la quedan, en caso contrario, la descartan. 


Las primeras redes en bus utilizaban un cable coaxial grueso, co- 
nectores tipo BNC, y los ordenadors se conectaban al mismo con 
un dispositivo denominado transceptor (transceiver), que era exte- 
rior. Con posterioridad, apareció una nueva versión, con un cable 
más fino (thin-ethernet) y con unos transceptores más pequeños, 
de manera que se podían integrar en el adaptador de red y así no 


se veían. 





Nota 





Los caprichos de la electrónica exigen que el cable 
esté “tapado” en los dos extremos, para que los bits no 
se “pierdan”. Ello se lleva a cabo con una resistencia 


de carga. 


Cuando un ordenador pone una trama en el cable, ésta 
recorre el cable por completo en los dos sentidos hasta 


los extremos, donde es absorbida por los tapones. 








| 4.3. Topologia en anillo 


La topologia en anillo consiste en conectar cada ordenador a dos 
mds, de manera que se forme un anillo. Cuando un ordenador 
quiere enviar una trama a otro, ésta debe pasar por todos los or- 
denadors que haya entre ellos: la circulación por el anillo es uni- 


direccional. 





Figura 18. 














El dispositivo que conecta el ordenador al anillo es el repetidor, un 


circuito con tres conexiones: 





Figura 19. 














+ Conexión de entrada de tramas desde el anillo al ordenador (A). 
e Conexión de salida de tramas desde el ordenador al anillo (B). 
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e Conexión bidireccional, por la que pasan todas las tramas que 


entran y salen del ordenador (C). 
El repetidor tiene tres modos de trabajo: 


e Modo escucha: el repetidor toma las tramas que le llegan por A y 
las pone simultáneamente en B y C, para que continúen por el 
anillo y para que el ordenador reciba una copia de las mismas y 
la analice. Si es el destinatario de la trama, se la queda y, en caso 


contrario, la descarta. 


e Modo transmisión: el ordenador envía información a la red. Pone 
una trama en C, de manera que cruza el repetidor y sale por B 


hacia el ordenador siguiente del anillo. 


e Modo cortocircuito: las tramas que llegan por A se ponen directa- 
mente en B sin proporcionar una copia de las mismas al ordena- 
dor. Este modo sirve para que el anillo continúe funcionando si el 


ordenador correspondiente no está activo. 


| 4.4. Pseudotopología de las redes inalámbricas 


Hablar de topología en una red inalámbrica parece fuera de lugar, 
porque no ‘vemos’ ningún medio de transmisión. Pero en realidad el 
“éter” por donde viajan las ondas se considera un medio de transmi- 
sión, y si lo comparamos con las tres topologías descritas, vemos que 


se puede comparar a la topología en bus. 





Nota 





De hecho, las ondas electromagnéticas no necesitan 
ningún soporte físico para ser transmitidas. Se propa- 
gan en el vacío. Pero hasta que esto no fue demostra- 
do, los científicos utilizaban el término “éter” para 
designar algo que se imaginaban que tenía que existir 


pero eran incapaces de ver. 





En un anillo o en una estrella en realidad existen ‘n’ medios indepen- 


dientes que conectan una estación a otra (o al punto central), mien- 


tras que en un bus tenemos un sólo medio (un cable) al que se 
conectan todas las estaciones, de la misma manera que en una red 


inalámbrica tenemos un solo medio (el aire) donde las estaciones 
ponen sus tramas. 








Figura 20. 





La topología, como veremos más adelante, condiciona los mecanis- 
mos de acceso al medio que se pueden usar en una red local. En el 


caso de las redes inalámbricas esto es particularmente determinante. 
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| 5. Cableado estructurado 


Las topologías en bus y en anillo comportan un serio problema de 
cableado a la hora de implementarlas. Aunque es relativamente 
sencillo montar una red en bus o en anillo, es muy complicado 
mantenerla y ampliarla: cuando falla un cable o una conexión, la 
red entera deja de funcionar, y no es sencillo localizar el punto 
exacto donde se encuentra el fallo. Es preciso comprobar la red 
entera, lo que en numerosas ocasiones es complicado, puesto que 
los cables pueden pasar por falsos techos o conducciones de difícil 


acceso. 


Este problema ha hecho pensar en un nuevo diseño de red más con- 


trolable: el cableado estructurado. 


El cableado estructurado consiste en hacer una preinstalación de red 
similar a la de las redes telefónicas. A cada punto de trabajo se ha- 
cen llegar dos líneas: una para el teléfono y otra para los datos. To- 
dos los cables llegan a una habitación, donde se establecen las 
conexiones: los cables de teléfono se direccionan hacia la centralita 
y los de los datos, hacia un dispositivo que permite la interconexión 


en red local. 


En 1991 se publicó el EIA/TIA 568 sobre cableado de telecomunica- 


ciones para edificios comerciales. El propósito de dicho estándar es: 


e Ser universal, tanto en servicios soportados como en fabricantes 


compatibles. 


e Ser base para el desarrollo de ottros estándares de comunicacio- 
nes (voz, imagen, LAN, WAN). 


e Definir parámetros que permitan definir y establecer el cablea- 
do del edificio incluso antes que nadie lo ocupe. Se concibe el 
cableado como un servicio más del edificio (luz, agua, gas... y 
datos). 
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EIA/TIA: 


Electronic Industries Association 
/Telecommunication Industry 
Association. 





Hablando con propiedad 


diremos que una red tiene 
topologia fisica en estrella y 
topología lógica en bus. 





Lectura complementaria 





Una buena aproximacién al 
funcionamiento de los con- 
centradores y los conmuta- 
dores la encontraréis en: 


A.S. Tanenbaum (2003). 
Redes de computadores. 
Méjico: Pearson Educación. 
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El estándar especifica las señales a usar, así como los aspectos me- 


cánicos de los cables, los conectores, los armarios, etc. 


Por norma general, se realiza un cableado a dos niveles: 


e Cableado horizontal: en cada planta (si es preciso cablear varias) 


se ponen cables desde un armario hasta los puntos terminales. 


e Cableado vertical: desde cada armario de planta se ponen ca- 
bles hasta una habitación del edificio donde se encuentran los 
dispositivos de red, los direccionadores (routers) hacia el exterior, 


la centralita telefónica, etc. 


En cada planta necesitamos crear una red local en el punto donde 
confluyen los cables que provienen de cada una de las estaciones. 
Parece que una topología en estrella sería la más adecuada, pero 
como hemos comentado, tal como se había concebido, era la que 
ofrecía menos prestaciones. La solución es combinar las ventajas de 
la topología física en estrella con el funcionamiento de los buses o 
los anillos. O sea, usar para interconectar las estaciones un disposi- 
tivo, alojado en el armario de planta, que se comporte como un bus 
o como un anillo. En el caso del bus (la topología más utilizada ac- 
tualmente), este dispositivo se conoce como concentrador o, en in- 


glés, hub. 


Una topología así, donde el elemento central es un dispositivo ac- 
tivo que está simulando un dispositivo pasivo, llevó al desarrollo de 
las LAN conmutadas. El razonamiento es el siguiente: cuando el 
hub recibe una trama, para comportarse como un bus tiene que re- 
enviarla hacia el resto de estaciones. Pero, el hub tiene capacidad 
de proceso: puede analizar la trama y, en particular, puede averi- 
guar cual es su destinatario. Entonces, si el hub conoce los identifi- 
cadores de las diferentes estaciones que tiene conectadas, puede 
enviar la trama únicamente a su destinatario, y así disminuir el nú- 
mero de tramas en la red, y, por tanto, aumentar la eficiencia. Los 
dispositivos que se comportan así se denominan conmutadores (en 


inglés, switch). 


Por lo que se refiere al medio físico, se usan tanto pares de cobre 


trenzados como fibra óptica, aunque en mucha mayor medida los 


primeros por su menor coste para similares prestaciones. Se han es- 
pecificado categorias de cables, cada cual con unas capacidades y 
unos requisitos minimos a cumplir. Hoy en dia el mds usado es el ca- 
ble categoría 5e, que pemite un ancho de banda de 100 MHz, el re- 


querido para las LAN de alta velocidad, como Fast Ethernet y Gigabit 
Ethernet. 





Si falla un cable, sólo falla una estación de trabajo, no toda la red, 
y, si falla toda la red, es que se ha estropeado el concentrador. Tanto 


un caso como el otro son muy rápidos de solucionar. 





Actividad 


Los que tengáis acceso a una instalación con cableado 
estructurado, estudiadla: observad las conexiones, los 


cables, los armarios de planta, los conmutadores, etc. 
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Hablaremos de FastEthernet 


y Gigabit Ethernet en el 
apartado siguiente. 





| 6. Control de acceso al medio 


Dado que cualquier ordenador de la red puede poner tramas al me- 
dio compartido, es preciso establecer mecanismos de control que re- 


gulen este acceso de manera eficiente, justa y fiable. 





En general, los protocolos de acceso al medio se pueden clasificar 


en tres grandes grupos: 


e Control de acceso al medio estático 
e Control de acceso al medio dinámico (centralizado o distribuido) 


e Control de acceso al medio aleatorio 


Cada uno de estos tipos de accesos tiene ventajas e inconvenientes, y 
se apli-can a redes muy diferentes. De hecho, las políticas de acceso 
al medio están muy vinculadas a la topología utilizada. De este modo, 
en una topología en anillo, la manera más natural de controlar el ac- 
ceso es por paso de testigo (token passing), que es un ejemplo de con- 
trol dinámico distribuido. En la topología en bus, también se puede 
utilizar este sistema; sin embargo, está mucho más generalizado el uso 
de la técnica CSMA/CD, que es de tipo aleatorio. En las redes inalám- 
bricas se usa una política de acceso al medio que es una combinación 


de control estático y aleatorio. 


En esta unidad vamos a describir las dos políticas más comunes 


hoy en día en las redes cableadas: el paso de testigo y CSMA/CD. 


| 6.1. Paso de testigo 


Como decíamos, la política de paso de testigo es la más apropiada 


para las redes en anillo. Así pues, para describir su funcionamiento 
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Lectura complementaria 


Podéis encontrar la defini- 
ción de todos los tipos de 
control de acceso al medio 
en: 


A.S. Tanenbaum (2003). 
Redes de computadores. 
Méjico: Pearson Educación. 


CSMA es la sigla de Carrier 
Sense Multiple Access (acce- 


so múltiple por detección de 
portadora) y CD es la sigla 
de Collision Detection (de- 
tección de colisiones). 





IEEE es la sigla del Institut of 


Electric and Electronic Engi- 
neers (Instituto de ingenie- 
ros eléctricos y electrénicos). 
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asumiremos que estamos en una red de esta topologia. En inglés es- 
tas redes se denominan token-passing ring, literalmente “anillo con 


paso de testigo”. 
El funcionamiento de la politica de paso de testigo es el siguiente: 


Se define una trama especial, el testigo. Cuando una estación lo 
recibe, tiene permiso para poner una trama propia en la red. Una 
vez esta trama ha dado toda la vuelta, y después de que sus des- 
tinatarios se hayan quedado una copia de la misma, la estación 
que la ha puesto la quita y libera el testigo que llegará a la esta- 
ción siguiente del anillo. Esta estación repite el procedimiento: 
saca el testigo de la red y pone una trama suya o, si no tiene nada 
para enviar, pasa el testigo a la estación siguiente. Las estaciones 
que tengan información para transmitir deben esperar a tener el 


testigo para ponerla en la red. 


Este mecanismo de control del medio permite con la misma faci- 
lidad la emisión de tramas tanto a una sola estación como a muchas. 
La trama recorre todo el anillo, por tanto todos los repetidores la 
ven pasar. Cada uno comprueba si en el campo “destinatario” de 
la cabecera de la trama aparece su identificador. En caso afirma- 
tivo, se queda una copia y la retransmite hacia la siguiente esta- 


ción. En caso contrario la retransmite sin quedarse copia. 


Las velocidades de trabajo de las redes en anillo con testigo están 
normalizadas: 4, 16 y 100 Mbps. Si se utiliza fibra Óptica como me- 
dio de transmisión, la red, que se denomina FDDI (fiber distributed 


data interface), puede superar los 100 Mbps. 


Las redes de paso de testigo fueron inventadas por IBM. Con poste- 
rioridad, el IEEE elaboró el estándar 802.5, que recogía toda la in- 


formación existente sobre las mismas. 


| 6.2. CSMA/CD 


Como ya hemos comentado, CSMA/CD es una política de acceso al 
medio de tipo aleatorio, lo cual quiere decir básicamente que las es- 
taciones no acceden al medio de una forma prefijada sino cuando 


quieren. De esta forma se consigue aumentar la eficiencia de la red 


con respecto a los sistemas de control estáticos. Obviamente hará falta 


controlar el caso en que dos estaciones quieran transmitir a la vez. 





Nota 





Los mecanismos de control del tipo estático se basan 
en repartir el acceso al medio entre las estaciones de 
forma fija. Si cuando a una estación le toca acceder al 
medio no tiene nada que transmitir, el lapso de tiempo 
asignado no puede ser aprovechado por otra y el me- 
dio queda desocupado. 


De políticas de acceso al medio de tipo aleatorio hay varias, pero las 
"comercialmente útiles" son dos, CSMA/CD y CSMA/CA. La primera es 
la más indicada para redes con topología en bus (ya sea con un bus 
real, cableado, como con un hub, en un entorno de cableado estructu- 
rado). La segunda es la que se usa en las redes inalámbricas Wi-Fi, que 


como hemos comentado, tienen una topología asimilable a un bus. 


Veamos en primer lugar como funciona CSMA, para luego describir 


la funcionalidad adicional de la detección de colisiones (CD). 


La política de acceso CSMA (acceso múltiple por detección de porta- 


dora) funciona de la manera siguiente: 


Los ordenadores escuchan constantemente el medio (miran si hay por- 
tadora). Cuando tienen una trama para transmitir, si detectan que no 
hay actividad en el medio, la ponen y, en caso contrario, esperan y si- 
guen escuchando hasta que el medio queda libre, entonces transmi- 
ten su trama. Si no tienen nada para transmitir, cuando detectan una 


trama en el medio, la toman y la procesan. 


Este algoritmo presenta un inconveniente claro: existe la posibili- 
dad de que dos estaciones quieran enviar una trama en el mismo 
momento. Ambas escuchan el medio, no detectan actividad y emiten 
simultáneamente. Entonces se produce una colisión: las señales 
electromagnéticas se mezclan y el resultado es algo ininteligible. 
El control de errores que se efectúa en el subnivel LLC será el en- 
cargado de detectar dicha circunstancia y solicitar la retransmi- 


sión de las tramas que se han corrompido. 


Podemos mejorar la política CSMA añadiéndole un procedimiento 


adicional: cuando una estación ya ha empezado a transmitir, si- 
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gue escuchando el medio para detectar si se produce una colisión, en 
cuyo caso deja de transmitir inmediatamente, para reducir así el tiem- 
po de colisión, y espera un tiempo aleatorio (es una manera de evitar 
una nueva colisión) para volver a empezar el proceso. Esta variante re- 


cibe el nombre de CSMA/CD, por la detección de las colisiones. 


Este modo de trabajo marca la existencia de un parámetro muy impor- 


tante en las redes CSMA/CD, que es la longitud mínima de trama. 


Una trama en una red local CSMA/CD ha de ser suficientemente larga 
para que una colisión sea detectada antes de que finalice su transmi- 
sión. Esta longitud mínima de trama es función Únicamente de la ve- 
locidad de transmisión de las señales en el medio. Este parámetro, a 
su vez, marca otro, también muy importante en el diseño de redes, 
como es el diámetro de la red, o distancia entre las estaciones más 


alejadas. 


La red Ethernet es una topología en bus que utiliza la política de acceso 
al medio CSMA/CD y fija como longitud mínima de trama 512 bits. La 
inventó Xerox, ¡unto con Intel y Digital, y el IEEE la elevó a la categoría 
de estándar: IEEE-802.3. 


La red Ethernet trabaja a 10 Mbps. Con posterioridad, apareció la 
FastEthernet, que trabaja a 100 Mbps, y, más tarde, la Gigabit 


Ethernet que, como su nombre indica, trabaja a 1 Gbps. 





Actividad 


Que una red vaya a 10 Mbps no quiere decir que todas 
las conexiones se realicen a esta velocidad. Si tenéis ac- 
ceso a una red de área local, por un lado, averiguad a 
qué velocidad funciona y por otro, haced una transfe- 
rencia de información entre dos estaciones y medid la 
velocidad real a la que se ha realizado (el cociente entre 
el número de bytes transmitidos, multiplicado por ocho, 
y dividido por el tiempo que ha durado la transmisión, 
en segundos). Cuánto más grande sea el fichero que 
transmitáis, mejor. Podéis hacer la prueba bajo diferen- 
tes condiciones de trabajo, como por ejemplo con pocas 
estaciones activas, con muchas transmisiones simultá- 
neas, etc. Comparad los valores obtenidos con la velo- 
cidad nominal de la red. 





|m. TCP/IP 


| 7. Estructura de protocolos en Internet 


El modelo Internet gira en torno a los protocolos TCP/IP. IP es un pro- 
tocolo que proporciona mecanismos de interconexión entre redes de 
área local y TCP proporciona mecanismos de control de flujo y erro- 


res entre los extremos de la comunicación. 


No se trata de una arquitectura de niveles formal como la torre OSI, 
que ya hemos visto en la unidad 1. De hecho, podríamos considerar 
que el modelo de la red Internet consta sólo de cuatro partes o nive- 
les; es decir, todo lo que hay por debajo del IP, el IP, el TCP y todo 
lo que hay por encima del TCP: 


1) Por debajo de IP. A este nivel, en el entorno Internet, se le llama 
nivel de red local o, simplemente, nivel de red. Por norma general, 
está formado por una red LAN, o WAN (de conexión punto a pun- 
to) homogénea. Todos los equipos conectados a Internet imple- 


mentan dicho nivel. 


2 


— 


Nivel IP o nivel Internet (nivel de Internetworking). Este nivel 
confiere unidad a todos los miembros de la red y, por consi- 
guiente, es el que permite que todos se puedan interconectar, 
con independencia de si se conectan a la misma por medio de 
línea telefónica, ISDN o una LAN Ethernet. El direccionamiento 
y la asignación de direcciones constituyen sus principales fun- 
ciones. Todos los equipos conectados a Internet implementan 


este nivel. 


3 


— 


Nivel TCP o nivel de transporte. Este nivel confiere fiabilidad a 
la red. El control de flujo y de errores se lleva a cabo principal- 
mente dentro de este nivel, que sólo es implementado por los 
equipos usuarios de la red Internet o por los terminales de Inter- 
net. Los equipos de conmutación (direccionadores o routers) no lo 


necesitan. 
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4) Por encima de TCP. Nivel de aplicación: Este nivel corresponde 
a las aplicaciones que utilizan Internet: clientes y servidores de 
WWW, correo electrónico, FTP, etc. Por ello se le denomina nivel 
de aplicación. Sólo es implementado por los equipos usuarios de 
la red Internet o los terminales de Internet. Los equipos de conmu- 


tación no lo utilizan. 





Figura 21. 








Modelo Internet 


Nivel de aplicacién 


Nivel de transporte 


Nivel de Internet 


Nivel de red 





Es importante destacar que sólo los equipos terminales implementan 
todos los niveles; los equipos intermedios únicamente implementan 


el nivel de red y el nivel IP. 





Figura 22. 








Situación de los niveles de la Red Internet 


E S ALe A e D 


+i 


Estación : Direccionador Direccionador + Estacién 





Internet se situa “encima” de las redes locales ya existentes. No 


redefine el concepto ni propone protocolos de red local nuevos. 


| 7.1. Protocolos de Internet 


En los niveles intermedios existen otros protocolos complementarios, 
además de TCP e IP. La figura siguiente sería un mapa bastante com- 


pleto de los protocolos que se usa en Internet: 





Figura 23. 











Protocolos 


Como ya hemos comentado, el concepto nivel no existe en Internet. 
Este concepto se utiliza en otros modelos de red, como la OSI. No 
obstante, como es un concepto útil, lo utilizaremos para plantear el 


estudio de los diferentes protocolos de la manera siguiente: 


a) En primer lugar, describiremos el IP y los protocolos que colabo- 
ran con él: ARP e ICMP. 


b) Después, estudiaremos ciertos aspectos básicos del nivel de red 
para las diferentes posibilidades de conexión a Internet actuales: 


las LAN Ethernet y los accesos por línea punto a punto con el pro- 
tocolo PPP o con ADSL. 


Dejaremos para unidades posteriores el estudio del nivel de trans- 


porte y del nivel de aplicación. 
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| 7.2. Encapsulamiento 


En cualquier arquitectura de niveles (sea más o menos formal) en que 
exista una comunicación vertical dentro de cada máquina, los datos 
que se generan en el nivel superior (aplicación) atraviesan el resto de 


niveles para “salir” de la máquina por el nivel físico. 


Cada uno de estos protocolos funciona con unas estructuras fundamen- 
tales que genéricamente se conocen como PDU (protocol data units). Sin 
embargo, en cada nivel se utilizan nombres diferentes para denominar 
lo que, de hecho, tiene funciones equivalentes. En el conjunto de proto- 


colos Internet tenemos las siguientes PDU: 


Las PDU Ethernet o PPP se denominan tramas. 


e Las PDU del nivel de interconexión (IP o ARP) se suelen denominar 
paquetes, aunque las PDU ICMP se suelen denominar mensajes, se- 


guramente porque viajan en paquetes IP. 


e En el nivel de transporte, se habla de segmentos en TCP, y de da- 


tagramas en UDP. 


e En niveles superiores que utilizan UDP, por norma general se utiliza 
la palabra PDU (SNMP-PDU, por ejemplo). En el caso del TOP, el ser- 
vicio que proporciona a las aplicaciones es el flujo de bytes sin es- 
tructura (byte stream). Por tanto, el concepto PDU deja de tener 


sentido en el nivel superior a TCP. 


El resultado de los diferentes encapsulamientos en cada nivel es 
que, cuando el nivel superior decide transmitir cierta información, 
se provoca una cascada de PDU que va descendiendo hasta el nivel 
inferior, que finalmente es el que transmite físicamente los bits que 


resultan del mismo. 





Nota 





Para calcular la longitud de trama necesaria para 
transmitir un byte de información, veremos, a modo 
de ejemplo, la emulación de terminal que efectúa el 
programa telnet y el protocolo que lleva el mismo 


nombre. 














Imaginemos que pulsamos una tecla sobre la ventana 
del programa telnet. Esta acción llega en forma de 
un byte Unico al nivel TCP, que encapsula dicho byte 
en un segmento TCP. Este segmento tendrá una ca- 
becera de 20 bytes y un contenido que será el byte co- 
rrespondiente a la tecla pulsada. Estos 21 bytes se 
transportarán dentro de un paquete IP que, general- 
mente, formará un paquete con 20 bytes de cabecera 
más el contenido ya mencionado de 21 bytes. Este 
paquete de 41 bytes irá, a su vez, dentro de una tra- 
ma que lo transportará por su soporte físico de trans- 
misión. Si el soporte de transmisión es una línea 
telefónica con un módem y utilizamos PPP, el resulta- 


do puede ser que le añadamos 8 bytes más. 


De todo ello resulta una trama de 49 bytes (8 + 20 + 
+ 20 + 1) de longitud para transmitir uno solo. La fi- 


gura siguiente muestra esta estructura: 








Figura 24. | 
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| 8. El IP (Internet protocol) 





El IP es del tipo best effort (podríamos traducirlo como ‘con la mejor in- 
tención”, o “quien hace lo que puede no está obligado a más”). 
Evidentemente, cuando utilizamos una red, no siempre podemos 
conformarnos con conseguir que la información llegue si la red puede. 
Aquí interviene el TCP, que es responsable de conseguir que la informa- 


ción llegue en las condiciones de fiabilidad deseadas. 





Nota 





Hay detractores acérrimos, así como defensores incondi- 
cionales de la filosofía best effort, aplicada a las redes y, 
seguramente, ambos grupos tienen una parte de razón. La 
red X.25 es un ejemplo casi opuesto a esta filosofía que 
proporciona a sus usuarios unos niveles de fiabilidad y fle- 
xibilidad razonablemente elevados, gracias a la utilización 


de la conmutación de paquetes con circuitos virtuales. 


De hecho, la historia da la razón a los defensores de la 
filosofía best effort, puesto que el X.25 actualmente se 
considera una tecnología casi obsoleta, mientras que el 
IP. está de moda. Las razones deben buscarse, como 
siempre, en el coste. La filosofía IP permite implementar 
redes con un coste mínimo: pensad que el TCP sólo pre- 
cisa implementarse en los terminales de la red, y no enlos 
nodos de conmutación. Por tanto, los nodos de conmu- 
tación IP son mucho más simples que los de X.25. 
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Lectura complementaria 


Una buena descripción de 
los algoritmos de direccio- 
namiento usado en Internet 
se puede encontrar en: 

W.R. Stevens (1994). TCP/IP 


Illustrated. Vol. 1 The protocols. 
Wilmintong: Addison-Wesley. 





El Unico objetivo de esta no- 
tación es la legibilidad hu- 


mana. No se puede perder 
nunca de vista que una di- 
reccion IP son 32 bits. 
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| 8.1. Direcciones IP 


Las direcciones IP son únicas para cada máquina. Para ser preci- 
sos, cada dirección es única para cada una de las interfaces de red 
IP de cada máquina. Si una máquina dispone de más de una interfaz 


de red, necesitará una dirección IP para cada una. 
Las direcciones IP tienen una longitud de 32 bits (4 bytes). 


Para representar una dirección, se suele escribir los 4 bytes en deci- 


mal y separados por puntos. Por ejemplo: 
212.45.10.89 


La numeración en IP sigue una filosofía jerárquica. Cada dirección está 
formada por dos partes. Una corresponde a la red donde está la esta- 


ción y la otra, a la propia estación. 


Para conseguir que no haya ninguna dirección igual, Internet dis- 
pone de una organización denominada Internet Network Information 
Center o InterNIC que se dedica a esta tarea. En la actualidad, esta 
entidad delega la responsabilidad de la asignación de direcciones 
a entidades regionales. Las direcciones se asignan por grupos o re- 


des, no individualmente. 


Los tipos de redes que tienen cabida en Internet se distinguen por la can- 


tidad de estaciones que pueden soportar, y son los siguientes: 


1) Las redes de clase A reservan el primer byte como identificador 
de red y los tres restantes como identificadores de estación. El pri- 
mer bit del primer byte vale O, por tanto, en Internet sólo puede 
haber 128 redes de clase A (con 22% estaciones cada una como 
máximo). Hace mucho tiempo que ya no queda ninguna para 


asignar. 


2 


— 


Las redes de clase B tienen 16 bits para cada campo; los dos pri- 
meros bytes del identificador de red valen 1 0, por tanto, hay 
16.384 (211) redes de, como mucho, 65.536 estaciones. De clase 


B no queda ninguna para asignar. 


3) Las redes de clase C reservan 24 bits para el identificador de red 
(con los tres primeros bits 1 1 0) y los 8 restantes son para el iden- 


tificador de estación. 


Una vez que se conoce una dirección, es fácil saber si corresponde a 


una red de clase A, B o C, como se puede ver en la figura siguiente: 





Figura 25. | 








Clase A 
De 0.0.0.0 o 127.255.255.255 


Close B 
De 128.0.0.0 o 191.255.255.255 


Clase C 
De 192.0.0.0 a 223.255.255.255 


Clase D 
De 224.0.0.0 a 239.255.255.255 


Clase E 
De 240.0.0.0 o 255.255.255.255 





La clase A está pensada para grandes empresas o corporaciones, 
con muchos terminales por identificar; la clase B, para corpora- 
ciones medianas; la clase C, para entornos mucho más peque- 
ños; la clase D está destinada al tráfico multicast IP, y la clase E, 
de momento, no tienen ningún uso concreto. La dirección comen- 


tada con anterioridad (212.45.10.89) es de clase C. 





Nota 





Classless Inter-Domain Routing (CIDR) 


El espacio de direcciones se está agotando a marchas 
forzadas y, si bien existen técnicas relacionadas con la se- 
guridad que ayudan a mitigar este problema (como el 
NAT, network address translation) el hecho de utilizar el 
concepto de “clase” ha agravado el problema: algunas 
corporaciones que han reservado una red clase A o B y 
sólo han aprovechado una pequeña parte de la misma, 
han dejado sin un buen trozo del espacio de direcciones 


al resto de Internet. 
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Hoy dia, en lugar de proporcionar redes clase C (de 
las otras ya no quedan) lo que se hace es dar grupos 
mayores (técnicamente, se podrían dar más pequeñas, 
pero no se hace) limitados por máscaras intermedias 
entre la clase B y la C. Por ejemplo, si alguien quiere 
una red de un millar de direcciones necesita cuatro re- 
des de clase C. En lugar de proporcionarle estas cuatro 
redes independientes, se le da una máscara de 22 bits: 
quedan 10 para direcciones de terminal, lo que permi- 


te 1.024 terminales. 








8.1.1. Máscaras de red 


Cuando un administrador de sistemas recibe el encargo de ges- 
tionar un conjunto de direcciones, es posible que necesite confi- 
gurar internamente diferentes LAN con este conjunto. Por ello, el 
mecanismo para distinguir distintas redes (LAN) entre sí no se puede ba- 
sar exclusivamente en los bits identificadores de clase que hemos co- 


mentado con anterioridad. 


La máscara de red constituye el mecanismo que nos permitirá 
conseguir más flexibilidad. Por medio de una máscara de 32 bits, 
definiremos los bits que identifican la red (bits en 1) y los que iden- 
tifican la estación (bits en 0). Por norma general, los bits 1 y los O 


son consecutivos, pero no necesariamente. 


A continuación, definimos de nuevo el concepto identificador de 
red, adaptándolo a la máscara: el identificador de red es la por- 


ción de dirección IP que encaja con los bits 1 de la máscara. 


El concepto máscara es capital para la comprensión del funciona- 
miento de las redes IP, permite a una estación decidir si el destino al 
que debe transmitir un paquete se encuentra dentro de la misma red 
de área local que este último o si, por el contrario, se encuentra en 
una LAN remota y, por tanto, debe delegar su transmisión a algún 
equipo de su misma LAN (el direccionador) para que se encargue de 


hacer llegar el paquete a su destino. 








Nota 





Si tenemos dos estaciones con las direcciones 
147.83.153.100 y 147.83.153.200, podemos deducir 
que están interconectadas directamente (por una LAN) si 
la máscara de su red es 255.255.255.0, así como dedu- 
ciríamos que no están conectadas con la misma LAN si la 


máscara fuese, por ejemplo, 255.255.255.128. 





Nota 





Una notación alternativa es proporcionar el número 
de bits 1 de la máscara. Así pues, la máscara 
255.255.255.0 es una máscara de 24 bits y la 
255.255.255.128 es una máscara de 25 bits. 


En ocasiones, podemos ver una dirección con el añadido 


de la máscara; por ejemplo: 
147.83.153.100/24. 


Sin embargo, esta notación sólo es útil para máscaras 


con l consecutivos. 








Cuando la máscara no coincide exactamente con la estructura de 


clases definida, entonces se habla de subnetting, porque estamos 


La mdscara 212.45.10.0/ 


creando subredes dentro de una red. Bape in eee 


tintas dentro de la red de 
clase C 212.45.10.0. 





8.1.2. Direcciones de propósito especial 


Existen diferentes direcciones especiales. Nosotros expondremos a 


continuación sólo las más importantes: 


e Dirección de red. Las direcciones de red se expresan con la di- 


rección que tendría cualquier estación suya y con todos los bits del 


81 


Ejemplo 


La dirección 127.03.87 es 
equivalente a la dirección 
12700m 
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identificador de estación a cero. Por ejemplo, la red en que se en- 
cuentra la estación 147.83.153.100/24 es la 147.83.153.0/24 y 
la red en que se encuentra la estación 147.83.153.200/25 es la 
147.83.153.128/25. 


Dirección 0.0.0.0. Esta dirección señala al mismo ordenador que 


la envía. Tiene dos funciones básicas: 


Aparecer como dirección origen en paquetes IP generados por esta- 
ciones sin dirección IP asignada. Normalmente sólo aparece mien- 
tras la estación intenta averiguar su dirección mediante protocolos 
como RARP (reverse address resolution protocol), BOOTP (bootstrap 


protocol) o DHCP (dynamic host configuration protocol). 


Servir al software de gestión de direccionamiento para indicar la 


ruta por defecto. 


Dirección 127.0.0.1 (loopback). Esta dirección no es válida para 
los paquetes IP. El software de red la utiliza para transmitir paque- 
tes a la máquina local (de hecho, los paquetes no son enviados, 
sino que son entregados al destino por el mismo sistema operati- 
vo). En realidad, los tres bytes del identificador de estación son 
irrelevantes. Esta dirección sólo tiene interés para programor apli- 
caciones; los sistemas de red no verán nunca que ningún paquete 


viaje por la red con esta dirección como origen o destino. 


Dirección 255.255.255.255 (broadcast). Esta dirección sólo es 
válida como dirección de destino de un paquete. Se utiliza para 
transmitir paquetes a todas las estaciones localizadas dentro de 
la misma LAN que la máquina de origen. Existe una versión 
equivalente, que es el broadcast dirigido. En este segundo caso, 
el paquete es recibido por todas las máquinas de una LAN es- 
pecificada por el identificador de red. El identificador de esta- 


ción debe ser todo 1. 


Por lo tanto, para enviar un broadcast a la red 147.83.153.0 
con la máscara 255.255.255.0 (o 147.83.153.0/24) podemos uti- 
lizar la dirección 255.255.255.255 si estamos dentro de la red 
147.83.153.0, o bien la 147.83.153.255 si estamos en una es- 


tación remota. El primer caso, lo llamaremos broadcast local, y 


el segundo, broadcast remoto. 


e Todas las direcciones de estos rangos: 


- 10.0.0.0/8 
— Dela 172.16.0.0/16 a la 172.31.0.0/16. 
— Dela 192.168.0.0/24 a la 192.168.255.0/24. 


Estas direcciones, que corresponden respectivamente a redes de 
clase A, B y C, no son asignadas por Internet, ni nunca lo serdn. 
Se utilizan en redes que trabajan con los protocolos TCP/IP pero 
no está previsto que se conecten directamente a Internet y, en 
caso de que se conectaran, estarían parcialmente ocultas por 
proxies o firewalls, que se encargan de reducir su dirección a otra 


que esté en los rangos de direcciones públicas. 


Por tanto, en las redes de clase A, B y C no tenemos 28, 216 o 224 esta- 
ciones posibles, respectivamente, sinó 28 — 2, 216 — 2 y 224 — 2. Las di- 
recciones que tienen todos los bits correspondientes a la estación a O y 


las que los tienen todos a 1 no son direcciones válidas para estaciones. 





Actividades 


* Indicad a qué clase pertenecen, cuál sería la direc- 
ción de red y la dirección de broadcast remoto de 


cada una de las direcciones IP siguientes: 


- 169.5.10.10/16 

- 124.127.122.123/8 
- 199.134.167.175 / 27 
- 201.201.202.202 / 24 
- 129.11.189.15 /20 


e Una empresa quiere montar una red de ordenado- 
res en un entorno TCP/IP. Para ello, ha decidido 
usar direcciones reservadas para intranet. Concre- 
tamente la red 192.168.206.0, pero sólo necesita 
espacio de direcciones para diez estaciones, y se 


plantean hacer una segmentación de la red. 


— ¿Cuál sería la máscara más restrictiva para este es- 
cenario? 


— ¿Cuál sería el rango de subredes posibles? 
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— Suponiendo que la dirección IP de una estación es 
192.168.206.100, ¿cuáles serían las direcciones 
del resto de estaciones? 


| 8.2. El formato del paquete IP 


Figura 26. 











Paquete IP 


— SC 


Cabecera Datos 


a) Versión: 4 bits g} Posición de este fragmento: 13 bits 
b) Longitud de la cabecera: 4 bits h) Tiempo de vida {TTL}: 8 bits 
c) Tipo de servicio: 8 bits i) Protocolo: 8 bits 
d) Longitud total del paquete: 16 bits į) Checksum: 16 bits 
e) Identificación del paquete: 16 bits k} Dirección de origen: 32 bits 
f) Indicadores: (flags) 3 bits l) Dirección de destino: 32 bits 
m) Opciones entre 0 y n « 32 bits (n<10) 





A continuación describiremos los campos que componen el paquete IP: 


+ Versión: siempre vale cuatro (0100), para los paquetes de la ver- 
sión actual (IPv4). 








Figura 27. 





Paquete IP 


— 


Cabecera Datos 


Versión: 4 bits 
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e Longitud de la cabecera: da la longitud de la cabecera en palabras 
de 32 bits (4 bytes). Por tanto, el número de bytes de la cabecera 
tiene que ser múltiplo de 4. Asimismo, limita la longitud de la cabe- 
cera a 60 bytes (15 : 4), puesto que 15 es el máximo que se puede 
expresar con cuatro dígitos binarios. Si no hay campo de opcio- 
nes, la cabecera tiene 20 bytes; por tanto, el campo en este caso 
valdría 5 (5 : 4 bytes = 20 bytes). 





Figura 28. 











Paquete IP 


— SC 


Cabecera Datos 


es ee Se fa A] 2 


Longitud de la cabecera: 4 bits 


e Tipo de servicio: este campo se encuentra dividido en varios sub- 
campos. Permite pedir un trato especial para el paquete y rara- 


mente se implementa. 








| Figura 29. 





Paquete IP 


— | 


Cabecera Datos 


MN O 1 Es] 


Tipo de servicio: 8 bits 


e Longitud total del paquete: da la longitud total del paquete (ca- 
becera incluida) en bytes. Como este campo es de 16 bits, un pa- 
quete IP no puede tener más de 65.535 bytes (216 — 1). 








Figura 30. 











Paquete IP 


—  §€§~| 


Cabecera Datos 


Hi Sistas eri 9) 


Longitud total del paquete: 16 bits 
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El campo Tipo de servicio 
permite definir dos variables: 
e El nivel de prioridad 

(del 1 al 8). 


* El tipo de calidad aplica- 
ble al contenido (retardo 
bajo, velocidad alta, fiabi- 
lidad alta, coste bajo, 
GCA 





Podéis ver la fragmentación 


de paquetes en el apartado 
8.2.1 de esta unidad. 
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e Identificación del paquete: contiene un identificador que es dife- 
rente para cada paquete que genera la estación. 








Figura 31. 





Paquete IP 


— 


Cabecera Datos 


A AA 


Identificación de! paquete: 16 bits 





* Indicadores (flags) y Posición de este fragmento: estos campos 
permiten gestionar la fragmentación de paquetes. 





Figura 32. 





Paquete IP 


— | 


Cabecera Datos 


DOSS La Al 


Indicadores (flags): 3 bits 


Paquete IP 


a 


Cabecera Datos 


PP (WES 


Posición de este fragmento: 13 bits 





e Tiempo de vida o TTL (Time To Live): indica el número máximo 
de direccionadores que puede cruzar el paquete. Se utiliza 
para evitar que un paquete pueda quedar dando vueltas inde- 
finidamente dentro de la red en caso de que haya algún problema 
al entregarlo. Cada direccionador disminuye el campo en uno; 
cuando uno de ellos detecta un paquete con TTL = 1, lo elimina y 
envía a quien lo ha emitido un mensaje de error por medio de 


un mensaje ICMP. 





Figura 33. 








Paquete IP 


— 


Cabecera Datos 


A E E 


Tiempo de vida (TTL): 8 bits 





e Protocolo: identifica el tipo de protocolo que transporta el paque- 
te. Los valores más comunes de los diferentes tipos de protocolos 


son los siguientes: 





ICMP 1 








Figura 34. 








Paquete IP 


— 


Cabecera Datos 


PEA ee | 


Protocolo: 8 bits 






e Checksum: realiza el control de errores en la cabecera. El campo Podéis ver una implementa- 
de datos no queda protegido por ningún checksum; es responsa- ción en lenguaje C del algorit- 
bilidad de los usuarios del IP (TCP, UDP, etc.) el control de los po- 


sibles errores en su contenido. 


mo checksum en el anexo 1. 





Figura 35. 











Paquete IP 


— SC 


Cabecera Datos 


Did E 


Checksum: 16 bits 
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Nota 





El checksum (o comprobación por adición) es básica- 
mente la suma aritmética de los bytes de la cabecera 
agrupados de dos en dos (si el resultado necesita más 
de 16 bits, se suman los bits sobrantes al mismo resul- 
tado). 


Este algoritmo, si bien es fácil y rápido de calcular, no 
se caracteriza por poseer unas grandes cualidades 
para la detección de errores. Ello, sumado al hecho de 
que el contenido del IP no tiene checksum y a otros fac- 
tores (tales como que muchos sistemas no calculan el 
checksum de los paquetes UDP), demuestra que en el 
mundo de Internet no existe un interés especial por la 
detección de errores. Con frecuencia, éste ha sido un 
argumento en el que se han basado los detractores del 


protocolo IP para atacarlo. 


La detección de errores dentro del campo de informa- 
ción es responsabilidad de quien entra la información. 
Los usuarios más habituales del IP son los protocolos 
TCP, UDP e ICMP, y todos protegen la información con 


un campo adicional de checksum. 








Actividad 


Buscad errores posibles que pasarían inadvertidos al 


algoritmo checksum. 





e Dirección de origen IP: identifica la máquina que ha generado el 


paquete. 





Figura 36. 








Paquete IP 


— SC 


Cabecera DIELEN 


MEAN ë ë Í S 


Dirección de origen: 32 bits 








e Dirección de destino IP: identifica la máquina a la que va desti- 


nado el paquete. 





Figura 37. 








Paquete IP 


— 


Cabecera Datos 


DUE | | 


Direccién de destino: 32 bits 


+ Opciones: existen diferentes servicios asignados a este campo, 
pero por lo general no se utilizan. Comentarems algunos de los 
mismos cuando hablemos del ICMP. Sea como sea, la longitud 
total está limitada a 40 bytes (15 - 4 — 20). 





Figura 38. 





Paquete IP 


— 


Cabecera Datos 


ME SL DOLE — 1b 


Opciones: entre O y n : 32 bits (n< 10) 


8.2.1. Fragmentación 


Los paquetes IP van siempre insertados en tramas de nivel de enlace 
o MAC. Unos ejemplos que ya hemos visto, son los protocolos PPP y 
Ethernet. 


La mayoría de protocolos de nivel de enlace fijan una longitud máxima 
de datos a transmitir en una trama. Esta longitud se conoce como MTU 
(maximum transfer unit) y está determinada por diferentes factores según 
el caso. En el caso de Ethernet, la MTU vale 1.500 bytes. 


Cuando una estación transmite un paquete IP, conoce la MTU de su in- 
terfaz de red, y está restringida a transmitir paquetes IP cuya longitud sea 
inferior o igual a esta MTU. Si el paquete pasa por un direccionador co- 


nectado a una red con una MTU inferior al tamaño del paquete, es pre- 
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ciso fragmentarlo. Los fragmentos resultantes de la operación son 


paquetes normales, pero con las características siguientes: 


e Todos los fragmentos que provienen de un paquete fragmentado 
tienen el mismo identificador de paquete en las respectivas cabe- 


ceras IP. 


* Todos los fragmentos indican con el campo Posición de este frag- 
mento a qué byte corresponde el primer byte de datos del frag- 
mento dentro del paquete original. El primer fragmento tiene un 


cero en este campo. 


+ La parte de datos de cada fragmento contiene un número de 
bytes múltiplo de 8. El último fragmento no tiene porque cumplir 


este requisito. 


¢ El bit + del campo Indicadores es 1 en todos los fragmentos a ex- 


cepción del último, que, por ello se suele denominar hay más. 


+ El resto de los campos de la cabecera se copia íntegramente del 
paquete original a los fragmentos que resultan de la fragmenta- 
ción, excepto el indicador de longitud del paquete y el checksum, 


que se deben calcular de nuevo. 





Figura 39. 








Paquete IP 


— | 


Cabecera Datos 


AE A E 
CANE [E 


| bit 1 bit 1 bit 





En principio, podríamos suponer que, cuando los fragmentos vuel- 
ven a una red con una MTU suficiente, el direccionador que los re- 
cibe los reunifica. Sin embargo, no se hace así, en primer lugar 
porque la ley no escrita de Internet según la cual el direccionador 
debe llevar a cabo el mínimo trabajo necesario no se cumpliría. En 
segundo lugar (y más importante), porque nadie garantiza que to- 
dos los fragmentos sigan el mismo camino. La única estación capaz 


de recomponer los fragmentos es la de destino. 


La estación de destino, cuando recibe un fragmento, reserva suficien- 


te memoria para alojar el mayor paquete IP posible (65.535 bytes), 


Este temporizador permite 
detectar la pérdida de un 


puesto que no tiene manera de saber cuál es el tamaño del paquete 


original. A partir de aquí, pone en marcha un temporizador* y em- fragmento por el camino y, 
por tanto, la pérdida de la 


pieza a recolectar los fragmentos según su identificador. Cuando se j 
memoria reservada. 





han recibido todos los fragmentos, se entrega el paquete a la aplica- 
ción (protocolo) correspondiente. En caso de que el temporizador 
salte, se descartan todos los fragmentos llegados hasta aquel mo- 
mento. El nivel superior (TCP) es el responsable de pedir una retrans- 
misión cuando convenga, puesto que el IP no dispone de ningún 


mecanismo para pedirla. 





Nota 





Dentro del campo Indicadores hay dos bits más que no 
hemos comentado: uno no se utiliza y el otro, el DF 
(Don’t Fragment), especifica que el paquete no debe 
fragmentarse. Si fuera preciso fragmentarlo, el paquete 
sería descartado y se enviaría un mensaje ICMP indican- 
do el error a la estación originadora del paquete. Usual- 
mente, se activa el bit DF sólo cuando la fragmentación 
no es deseable como, por ejemplo, cuando enviamos 
paquetes a estaciones con la pila TCP/IP implementada 
en ROM, puesto que entonces se implementa sólo una 


mínima parte de la funcionalidad de TCP/IP. 








Actividad 


Se debe transmitir un datagrama de 4.480 bytes y ne- 
cesita ser fragmentado porque pasará por una red 
Ethernet que admite un máximo de 1.500 bytes de datos. 
Indicad los valores del campo Longitud del paquete, del 
campo Posición de este fragmento y del bit + (MF), para 


cada uno de los paquetes IP que se generen. 








8.3. Direccionamiento y direccionadores 


Las atribuciones principales de los direccionadores son interconectar 
dos o más subredes IP y encargarse de direccionar el tráfico destina- 


do a estaciones remotas. 
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Podéis ver el ARP en la uni- 
dad 9. 
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Cada direccionador de la red Internet debe ser capaz de decidir (en una 
fracción de segundo) a dónde debe dirigir un paquete basándose exclu- 
sivamente en la dirección de destino, y en el conocimiento que tiene de 
la red y de su posición (la del direccionador) dentro de Internet. De he- 
cho, cada direccionador no decide la ruta entera del paquete, sino sólo 
el trozo de ruta en que participa: el salto (hop) siguiente. Entre el origen 
y el destino tenemos un número variable de saltos, y en cada uno de 
ellos participan un par de direccionadores (el emisor y el receptor del 
paquete) a excepción del primero y el último, en que participan las es- 
taciones emisora y receptora, respectivamente. Las conexiones entre di- 
reccionadores, o bien entre direccionador y estación terminal, las 


componen LAN o enlaces punto a punto. 





Figura 40. 











Transporte de un paquete IP a través de tres subredes 


Origen Direccionador A Direccionador B Destino 





En la figura anterior, podemos ver un paquete IP que cruza tres redes de 
área local. En cada una el paquete va encapsulado dentro de una trama 
de un tipo adecuado a la subred que cruza (en la figura podrían ser tres 
LAN Ethernet). Las direcciones de origen y de destino del nivel LAN en 
cada tramo son diferentes. En cambio, la dirección de origen y la de 
destino de cada paquete IP no varían. La situación plantea dos proble- 


mas y, para resolverlos, es preciso efectuar los pasos siguientes: 


e Averiguar cuál es la correspondencia entre direcciones IP y MAC (só- 
lo en los casos en que el enlace entre los direccionadores sea una 
LAN). Ello nos permitirá enviar los paquetes IP a un direccionador a 
pesar de que el paquete IP no tenga su dirección. El mapeado IP- 


MAC se efectúa de manera automática por medio del ARP. 


e Decidir en cada momento cuál es el direccionador siguiente (el 


salto siguiente). 


8.3.1. La tabla de direccionamiento 


El direccionamiento se lleva a cabo a partir de tablas de direccionamien- 
to que disponen de información limitada, pero suficiente para permitir la 
interconexión de todas las subredes que componen Internet. Cada equipo 


conectado a una red IP necesita una tabla de direccionamiento. 





Nota 





Estas tablas se introducen dentro del direccionador 
por medio de un terminal que se conecta al mismo di- 
rectamente (consola). Asimismo, existen protocolos 
que permiten que las tablas se actualicen automática- 
mente cuando se detectan cambios de topología. Los 
más utilizados son el RIP (routing information protocol) 
y el OSPF (open shortest path first). 





El direccionador decide la ruta de los paquetes consultando su tabla 
de direccionamiento. Las estaciones terminales también necesitan 
una tabla de direccionamiento, aunque sólo sea para poder descu- 
brir si se están comunicando con una estación local de la LAN (y, por 
consiguiente, se pueden comunicar directamente con la misma) o si 
el paquete IP debe ir a una estación remota (conectada a otra LAN) 


y, por tanto, deben dejarlo en manos del direccionador. 


Tabla de direccionamiento de una estación 
con una única interfaz 


Empezamos estudiando la tabla de direccionamiento de una estación 
conectada a una LAN (dirección 147.83.153.103/24) con una única 
tarjeta Ethernet. Por norma general, una tabla de direccionamiento dis- 
pone también de información sobre las “cualidades” de cada una de las 


rutas descritas, que no aparecen en el ejemplo: 





Tabla 2. 











Tabla de direccionamiento de la estación 


Dirección Máscara Direccionador Interfaz 
147.83.153.103 | 255.255.255.255 | 127.0.0.1 Loopback 
127.0.0.0 255.0.0.0 127.0.0.1 Loopback 











147.83.153.0 255.255.255.0 147.83.153.103 | etherO 
255.255.255.255 | 255.255.255.255 | 147.83.153.103 | etherO 
0.0.0.0 0.0.0.0 147.83.153.5 etherO 
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El comando route permite 
consultar y modificar la ta- 
bla de direccionamiento de 
una estación. Este comando 
está presente, con este 


nombre, en la mayoria de 


sistemas operaitvos, inclui- 
dos los GNU/Linux (y, en 
general, todos los sistemas 
Unix). 
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Esta es una tabla típica que podemos encontrar en una estación conec- 


tada a Internet. Las filas de la tabla o reglas se consultan no en el orden 


en que el comando route nos las presenta, sino en orden de máscara 


decreciente (en primer lugar, las entradas con 32 bits, etc.). De las en- 


tradas que forman la tabla es preciso señalar lo siguiente: 


La primera entrada y la segunda permiten transmitir paquetes 
IP a las direcciones 147.83.153.103 y a todas las direcciones 
que empiecen por 127 (fijaos en la máscara de las dos entra- 
das). En ambos casos los paquetes se envían a la interfaz vir- 
tual loopback (la interfaz con que se conoce el ordenador local 
desde el mismo ordenador local). Ninguno de los paquetes 
que se direccione con alguna de estas dos reglas saldrá a la 
red: será cortocircuitado directamente por el sistema operativo 
y se entregará al proceso de destino sin que nunca llegue a 


ninguna tarjeta de comunicaciones. 





Nota 





Una interfaz es una tarjeta de conexión física a la red. 
Ejemplos de interfaz serían una tarjeta Ethernet (por 
ejemplo, la EtherO) o un puerto serie al que conecta- 
mos un módem. Loopback, como ya se ha comenta- 


do, es un caso especial de interfaz 


Para saber qué interfaces hay disponibles en un siste- 


ma GNU/Linux, se dispone del comando ifconfig. 








La tercera entrada será adoptada por todos los paquetes desti- 
nados a la red local. El campo Direccionador es el mismo que la 
dirección local, lo que significa que no se delegará su transmisión 


a ningún direccionador. 


La cuarta entrada tiene una importancia relativa. Nos indica 


que los broadcasts IP se restringirán a la red local. 


La quinta entrada (0.0.0.0/0) permite a la estación comunicarse 
con estaciones remotas. Notad que la máscara no tiene ningún 
bit en 1. Ésta es la ruta por defecto. El direccionador establecido 
para acceder a estaciones remotas queda identificado en la tabla 
con la dirección 147.83.153.5. 


Toda esta información se calcula a partir de tres datos que se intro- 


ducen en la configuración de red: 


1) La dirección local (en el ejemplo: 147.83.153.103). 
2) La máscara de la LAN local (en el ejemplo: 255.255.255.0). 
3) La dirección del direccionador (en el ejemplo: 147.83.153.5). 


En casos más complejos (más de una interfaz de acceso a Internet, 
más de un direccionador en la red local, etc.), la información deberá 
modificarse con el comando route. Asimismo, existen otros meca- 
nismos que no requieren la intervención humana y que permiten des- 
cubrir direccionadores que no se han configurado previamente por 


medio del protocolo ICMP. 





Actividad 


Observad la tabla de direccionamiento de vuestro or- 
denador por medio del comando route. Consultad la 
ayuda disponible en el sistema operativo (en GNU/Linux 


haced man route). 


En un direccionador, las tablas de direccionamiento tienen más en- 
tradas que las de una estación; sin embargo, el funcionamiento es el 
mismo que hemos visto en el caso anterior. Observad una que co- 
necta la red 147.83.153.0/24 con el exterior por medio de la red 
147.83.30.0/24: 





Tabla 3. 








Tabla de direccionamiento del direccionador 


Dirección Máscara Direccionador | Interfaz 





147.83.153.5 255.255.255.255 | 127.0.0.1 Loopback 





147.83.30.2 255.255.255.255 | 127.0.0.1 Loopback 





127.0.0.0 255.0.0.0 127.0.0.1 Loopback 





147.83.153.0 255.255.255.0 147.83.153.5 | ether] 





147.83.30.0 255.255.255.0 147.83.30.2 etherO 





255.255.255.255 | 255.255.255.255 | 147.83.153.5 | etherl 





0.0.0.0 0.0.0.0 147.83.30.1 ether0 
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Prácticamente no observamos nada nuevo. Simplemente se han dupli- 
cado las entradas específicas de interfaz. El direccionador también tiene 
una entrada por defecto. En este caso, todo el tráfico no destinado a las 
dos redes a que está directamente conectado se direcciona hacia otro 
direccionador situado en la red 147.83.30.0 (el 147.83.30.1). 





Actividad 


Pensad si todos los direccionadores de Internet poseen 
una ruta por defecto y razonadlo. Imaginad qué sucede 
cuando enviamos un paquete a una estación de una 


red inexistente (por ejemplo, a la estación 10.0.1.1). 


| 9. El ARP (address resolution protocol) 


Al describir el funcionamiento de los direccionadores hemos visto 
que necesitan saber la dirección MAC correspondiente a una direc- 
ción IP. El ARP es el encargado de llevar a cabo la resolución auto- 


mática del mapeado entre direcciones MAC. 


Cuando efectuamos la transmisión de un paquete entre dos esta- 
ciones locales de una misma LAN, lo hacemos indicando a la apli- 
cación correspondiente sólo la dirección IP. Por ejemplo, si desde 
147.83.153.103 queremos conectarnos a 147.83.153.100, hare- 


mos lo siguiente: 
$ telnet 147.83.153.100 


Aplicando la máscara de red a la dirección IP solicitada, la estación 
deduce que se encuentra en su misma subred. Por tanto, no hace fal- 
ta delegar en ningún direccionador. Para poder enviarle las tramas en 
las que deben ir los paquetes IP que genera la aplicación telnet, ne- 


cesita conocer su dirección MAC. 


Para ello, emite una petición ARP. Se trata de un paquete encapsulado 
directamente sobre una trama Ethernet (con tipo = 0x0806). Como di- 
rección de destino lleva la dirección broadcast (FF:FF:FF:FF:FF:FF) para 
que llegue a todas las estaciones de la LAN, y como contenido, la direc- 
ción IP para la cuál se desa conocer la dirección MAC. La estación que 
reconoce su IP en la petición ARP responde con una respuesta ARP diri- 
gida al origen de la petición con su dirección MAC. De hecho, el conte- 
nido de la respuesta ARP es irrelevante, lo Unico importante es la 


dirección MAC de origen de la trama. 


Lo mismo sucede cuando la estación deduce que la IP solicitada por al- 
guna aplicación corresponde a una estación remota, o sea, de fuera de 
su LAN. En este caso, las tramas se deben enviar al direccionador para 
que se encargue de sacarlas de la LAN hacia su destino. Para ello, la 


estación origen debe averiguar la dirección MAC del direccionador. 
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telnet es una aplicación 


de uso común para el aceso 
a servidores remotos. La ve- 
remos en la unidad 17. 





No mostraremos el formato 
de los paquetes ARP, por- 
que no van a aportarnos 
mucha más información. 
Podéis encontrar el formato 


y los usos alternativos del 
ARP en: 


D. E. Comer (1995). 
Internet-working with TCP/IP 
(volumen 1: “Principles, 
Protocols, and Architecture”). 
Hertfordshire: Prentice Hall 





Es fácil deducir que,en el funcionamiento normal de una estación,. las 


peticiones ARP pueden ser muy habituales. Para evitarlo, cada estación 


En rigor, para cada trama 


dispone de una tabla las parejas ya obtenidas, de forma que si una di- 
con paquete IP a generar, 
se tendria que hacer una rección IP ya se encuentra es dicha tabla, no hace falta enviar ninguna 


petición ARP. petición ARP. Dicha tabla se denomina caché ARP, y tiene el siguiente 





aspecto: 





Tabla 4. 








Tabla caché ARP 


Dirección IP Dirección MAC Interfaz 





147.83.153.103 | 08:00:00:10:97:00 etherO 





147.83.153.5 00:0c:aa:00:0f:e0 etherO 














Cada fila corresponde a un mapeo IP-MAC y la interfaz para la cual se 


ha solicitado. 


Esta tabla se va llenando automáticamente a medida que se realizan 


A 7 nuevas peticiones, pero también se puede manipular con el comando 
En GNU/Linux, arp -a sir- p ,P p p 


ve para mostrar la tabla. arp. Con él se puede consultar, añadir o borrar entradas. 


Podéis consultar las páginas 
del manual para el resto de 
opciones. 


La tabla ARP se denomina caché porque, de hecho, actúa como una 





memoria auxiliar que evita la consulta de la información a la LAN mien- 
tras se tenga una copia local de la misma. Puede parecer que la consul- 
ta ARP no debería ser demasiado frecuente, puesto que al cabo de cierto 
tiempo toda la información se encontraría dentro de la caché. Conviene 
saber, sin embargo, que las entradas caducan al cabo de un periodo de 
tiempo relativamente breve (entre uno y unos cuantos minutos, según el 


sistema). 





Actividad 


Imaginad qué podría suceder si las entradas de la ca- 
ché ARP no caducaran. Os puede servir de ayuda pen- 


sar en la reconfiguración de direcciones. 


Algunos usos alternativos de interés del ARP son los siguientes: 


e ARP innecesario (gratuitous-ARP): se utiliza cuando una estación 
arranca para saber si hay alguna otra estación que está utilizando 


su misma dirección IP. Por medio de una petición ARP, puede pre- 
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guntar quién tiene su dirección IP (un conflicto de este tipo podría 


dejar las dos estaciones “fuera de combate”). 


ARP subsidiario (proxy-ARP): se utiliza en situaciones en las que 
un direccionador divide una subred sin que las estaciones ni el di- 
reccionador que los conecta a Internet modifiquen su máscara. 
Esta técnica, a pesar de no ser demasiado ortodoxa, se aplica con 
frecuencia cuando el direccionador de una red privada se conecta 
a Internet por medio de una red ajena (un proveedor de Internet, 


por ejemplo). 





Actividad 


Consultad la caché ARP de algún sistema que tengáis 
al alcance (Unix o MS) por medio de arp -a. Compro- 


bad qué opciones tiene disponibles. 
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| 10. El ICMP (Internet control message protocol) 


La cuestión de si el ICMP es un protocolo, o si más bien es una herra- 
mienta que utiliza el protocolo IP para notificar errores genera mucha 
polémica. Lo cierto es que el ICMP constituye el mecanismo básico 
para la gestión de las diferentes incidencias que pueden ocurrir en una 
red IP. 


| 10.1. Mensajes ICMP 


Los mensajes ICMP viajan dentro de paquetes IP (al contrario de lo 
que sucedía con los paquetes ARP), en el campo de datos con el cam- 
po Protocolo igual a 1. El formato del mensaje presentado en la fi- 
gura siguiente nos facilitará el estudio de los diferentes usos del 
paquete ICMP: 





Figura 41. 











Paquete IP 


Lo 


Cabecera Datos 


a) Tipo: 8 bits 

b) Cédigo: 8 bits 

c) Cheksum: 16 bits 

d} Contenido (depende del tipo de mensaje) 


Existen trece tipos de mensajes ICMP en uso en la actualidad, y al- 
rededor de una treintena de subtipos identificados con el campo 
Código. 
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Tabla 5. 








Descripcion 
Respuesta de eco (echo reply) Petición 


Petición de eco (echo request) Petición 





Destino inalcanzable (unreachable destination) 


Los diferentes códigos permiten definir si lo 
que no se puede alcanzar es la subred (0, 6, 9, 
11), la estación (1, 7, 10, 12), el protocolo (2), 
o el puerto (3) y los motivos 





Petición de control de flujo (source quench) Error 





Redireccionamiento Error 





Publicación de rutas Petición 





Petición de rutas Petición 





El tiempo de vida ha expirado (time exceeded) | Error 


Cabecera IP incorrecta Error 





Petición de hora Petición 


Respuesta de hora (en milisegundos desde la 


medianoche) Petición 





Petición de la máscara de la subred Petición 


Respuesta de la máscara de la subred Petición 














La última columna nos permite distinguir mensajes ICMP de notifica- 
ción de error de mensajes que son parte de una petición (la petición 
o la respuesta). Esta distinción es importante, puesto que los mensa- 
jes de error ICMP no pueden generar otros mensajes de error ICMP. 
En particular, no se generan mensajes de error en respuesta a los pa- 


quetes o mensajes siguientes: 


e Los mensajes de error ICMP. 


e Un paquete IP destinado a una dirección broadcast (sea un 
broadcast IP o un broadcast MAC). 


e Un fragmento que no sea el primero. 


e Una dirección de origen que no identifique una única estación. 
Por ejemplo, la dirección de origen válida 0.0.0.0 o la dirección 
de origen no válida 255.255.255.255. 
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Nota 





Parches 


Desgraciadamente, no todas las implementaciones 
TCP/IP han tenido en cuenta las excepciones existentes 
en la generación de mensajes de error, y algunos usua- 
rios desaprensivos han explotado estos problemas para 
bloquear sistemas y redes remotas. Asimismo, de vez en 
cuando se descubren nuevas excepciones que pueden 


afectar a nuestros sistemas. 


Los fabricantes de sistemas operativos publican re- 
gularmente parches (patch) que permiten solucionar 
los problemas (las vulnerabilidades) que se han des- 
cubierto desde la fecha de publicación de la última 


versión. 








| 10.2. El programa ping 


El programa ping permite descubrir si una estación se encuentra ac- 


tiva o no, simplemente efectuando lo siguiente: 
$ ping <direccion_IP_destino> 


El programa ping envía un mensaje ICMP del tipo 8 (petición de 
eco) con el destino indicado. El receptor de la petición debe respon- 
der con una respuesta de eco (ICMP tipo 0), y, cuando el ping la re- 
cibe, indica en pantalla que la estación remota está activa. 


Evidentemente, el programa debería llamarse ping-pong. 
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Figura 42. 








Mensaje ICMP de peticién de eco 


Poouete IP 


— 


Cobecera Dotos 


_ E 


Mensaje ICMP de respuesta de eco 
Poquete IP 


A 


MN lee) Dotos 


_ 


digo Checksum BAEN 


ll 


WEA 


relleno, etc.) 


olog 


El campo Tipo es ¡qu 





UTA 
relleno, atc 
RA 





Actividad 


Practicad el uso del programa ping. Comprobad qué 


retardos máximos se dan en Internet. Hacedlo a dife- 


rentes horas del día. 


Con el ping tenemos otras opciones disponibles. En particular, la 


opción de memorización de rutas (record route o RR; ping -R, en 


GNU/Linux), que no se refleja en ninguno de los campos del mensa- 


je ICMP, sino que se encuentra dentro de la misma cabecera IP, en 


el campo de opciones. 


Las diferentes opciones que se 
encuentran disponibles en la 
cabecera se identifican por me- 
dio del primer byte del campo 
de opciones de la cabecera IP 
(figura 43). 


Si el originador, por ejemplo, quie- 
re activar la opción RR, el primer 
byte debe ser 7. Sea como sea, en 
todas las opciones el primer byte 
indica el tipo, y el segundo, la lon- 
gitud en bytes de la opción. 





Figura 43. 





Opciones 





En este caso siempre se pide el mdximo posible, que es 39 bytes, 
puesto que el campo siguiente tiene un byte (puntero), al que sigue 
una cadena de campos de 4 bytes (que son las direcciones IP encon- 
tradas). El campo Puntero se inicializa a 4, y dentro de los 4 bytes si- 
guientes se guarda la dirección de la estación en que ejecutamos el 


ping. 


Cada direccionador debe mirar dentro de los paquetes IP (ICMP o 
no) para ver si tienen la opción RR activada. Si un direccionador en- 
cuentra un paquete con esta opción activada, modifica la posición 
apuntada por el puntero con su dirección (por norma general, la di- 
rección de salida del direccionador) e incrementa el valor del pun- 
tero en cuatro unidades. Cuando vuelve el mensaje de respuesta de 
eco, se ha añadido una lista con todos los saltos que ha tenido que 


realizar el paquete (tanto de ida, como de vuelta). 


El campo de opciones tiene limitaciones de tamaño: sólo dispone de 
36 bytes (39 — 3) para guardar direcciones IP. Como cada dirección 
ocupa 4 bytes, sólo hay espacio para nueve direcciones IP. Si a ello 
le añadimos que no todos los direccionadores comprueban si hay 
opciones dentro de los paquetes IP, o no actualizan la opción RR, 


hace poco util este tipo de ping en el mundo real. 





Actividad 


Comprobad la ruta a diferentes destinos por medio de 
un ping con la opción de memorización de rutas. Valo- 
rad si la comprobación de esta opción está muy exten- 


dida. 


| 10.3. El programa traceroute 


El programa traceroute permite encontrar las rutas entre un 
origen y un destino sin ninguna de las limitaciones del ping -R. Uti- 
liza un mecanismo bastante ingenioso basado en mensajes gené- 
ricos ICMP (y no los específicos petición de eco y respuesta de eco 


del ping). 
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El funcionamiento se basa en la explotación de dos mensajes 
ICMP: 


1) Tiempo de vida agotado (time-exceeded): cuando un direc- 


cionador recibe un paquete, aparte de las tareas primordiales 
de direccionamiento, debe reducir en una unidad el valor del 


campo TTL de la cabecera IP. 


En caso de que el valor (después de la reducción) sea cero, el 
paquete debe eliminarse. Sin embargo, esta eliminación no es 
silenciosa, sino que el direccionador responsable envía una 
notificación de la misma al originador del paquete por medio 
de un mensaje ICMP tipo 11 y código O (tiempo de vida ago- 
tado). 


Este paquete ICMP contiene la cabecera del paquete IP que se 
ha eliminado y los primeros 8 bytes de su contenido (segura- 


mente la cabecera UDP o los primeros bytes de la cabecera 
TCP). 





Figura 44. 











Paquete dd 


6 


Cabecera 


a) Tipo= 11 

b) Cédigo= 0 (6 1) 

c) Checksum 

d) No utilizados (los 32 bits están a 0) 


e) Cabecera IP con las opciones y 8 bytes 


del contenido original del paquete IP 





2) Puerto inalcanzable (unreachable-port): cuando una estación re- 


cibe un datagrama UDP o un segmento TCP destinado a un puer- 
to que la máquina no escucha, responde con un mensaje de error 


de puerto inalcanzable (tipo 3 con código 3). 





Figura 45. 











Paquete IP 


ee 


Cabecera Datos 


a) Tipo= 3 

b) Cédigo= 3 

c) Checksum 

d) No utilizados (los 32 bits están a 0) 

e) Cabecera IP con las opciones y 8 bytes 
del contenido original del paquete IP 





El programa traceroute simplemente debe enviar paquetes al 
destino con TTL secuencialmente ascendentes: el paquete (con in- 
dependencia del tipo que sea) que tenga el TTL= 1 será rechazado por 
el primer direccionador, el que tenga TTL = 2 lo será por el segundo, 
y así consecutivamente. Cada uno de los direccionadores devolverá 
un mensaje ICMP “tiempo de vida agotado”, una pista del todo sufi- 
ciente para que el originador averigúe el camino que han seguido 


todos los paquetes. 


Cuando el mensaje llega al destino, debe devolver algún mensa- 
je para saber que la secuencia ha finalizado. Por norma general, 
el mensaje será “puerto inalcanzable” si el mensaje enviado era 
un datagrama UDP a un puerto no usado, o bien una respuesta 
de eco si lo que se ha enviado son paquetes ICMP de petición de 


eco. 





Actividades 


Utilizad el programa traceroute para descubrir los 
caminos que siguen diversos paquetes hasta diferen- 


tes destinos. 


Probad qué sucede si nos conectamos a un puerto no 
servido. Por ejemplo, conectaos al puerto TCP 1234 


(podéis hacerlo con Telnet localhost 1234). 
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| 10.4. Mensaje de redireccionamiento 


Es normal que los sistemas se conecten a Internet sólo configurando 
su dirección IP, la máscara de la LAN y el direccionador que gestiona 
la comunicación remota. Cuando hay más de un direccionador en la 
LAN local, puede darse el caso de que para algunas rutas sea mejor 


usar otro direccionador y no el que tenemos configurado. 


A este efecto, los direccionadores disponen del mensaje ICMP de re- 


direccionamiento (redirect), que actúa de la manera siguiente: 


1) La estación envía un paquete al direccionador que tiene configu- 
rado (A). El direccionador A descubre que la mejor ruta pasa por 


utilizar el direccionador B. 
2) El direccionador A direcciona el paquete hacia el direccionador B. 


3) Notifica a la estación que modifique su tabla de direccionamiento. 





| Figura 46. 





Redireccionamiento de paquetes 


Estacién 


Direccionador A Direccionador B 





Notad que, normalmente, el direccionador continúa direccionando 
los paquetes (paso 2). Aunque la estación no hiciera caso del men- 
saje ICMP de redireccionamiento (paso 3), continuaría teniendo co- 
nectividad con el exterior; sin embargo, si le hace caso, mejorará el 


rendimiento del sistema. 


Cuando una estacién obedece a un ICMP de redireccionamiento, su 
tabla de direccionamiento queda convenientemente actualizada. El 
comando route puede proporcionarnos alguna pista de si este fe- 


nómeno tiene lugar. 
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| 11. Redes de acceso a Internet 


Las redes de acceso a Internet más habituales son la red telefónica 
(por módem) que se utiliza, sobre todo, en el ámbito doméstico, el 
ADSL (asymetric digital subscriber line, línea de abonado digital do- 
méstica) que, aunque utiliza la infraestructura de acceso de la red te- 
lefónica, no se puede decir que vaya sobre la línea telefónica, y la 
Ethernet. 


1) En accesos por medio de la red telefónica y, en general, en ac- 
cesos por medio de redes conmutadas (incluyendo el acceso por 


la RDSI), se suele utilizar el PPP (point-to-point-protocol). 





Nota 





Si bien durante mucho tiempo se han utilizado el SLIP 
(serial line Internet protocol) y el (compressed SLIP), en 
la actualidad se han dejado prácticamente de lado 
en favor del PPP, que tiene más flexibilidad (permite 
gestionar automáticamente ciertos parámetros IP y 
multiplexar, dentro de la misma conexión, diferentes 
protocolos de interconexión, aparte del IP) y es más fia- 


ble (dispone de CRC en cada trama). 








2) En LAN, el protocolo que se utiliza en más del 90% de los casos 
es la Ethernet. Nosotros nos centraremos sólo en los detalles de 
las direcciones de dicho protocolo, puesto que es lo único que 


afecta a la manera de funcionar del IP. 


Casi todos los protocolos de LAN que componen el 10% restan- 
te (IEEE802.3 CSMA/CD, lEEE802.5 Token Ring, etc.) utilizan 
una estructura de direcciones idéntica a la de Ethernet. De he- 
cho, podríamos hablar de compatibilidad, puesto que la asig- 
nación de direcciones se hace globalmente para todas las LAN 
mencionadas y la gestiona el IEEE (Institute of Electric and Electronic 


Engineers). 


11.1. Acceso telefónico: el PPP 


El PPP es fundamentalmente un protocolo derivado del HDLC 
(high-level data link protocol) para conexiones balanceadas 
(HDLC-ABM, HDLC-asynchronous balanced mode). El formato de 


la trama PPP se representa en la figura siguiente: 





Figura 47. 








16 bits 16 bits 





Los campos Indicador (flag), Dirección y Control están fijados en los va- 
lores de la figura anterior. El campo Dirección tiene el valor 11111111, 
que es el de difusión o broadcast en la mayoría de los protocolos (por 
ejemplo, en todos los HDLC). Ello significa que este campo (como el de 
control) no se utiliza. Su utilización en el PPP sólo se puede justificar por 
el posible uso de tarjetas HDLC genéricas para conexiones PPP. Como 
cualquier protocolo HDLC, debe aplicar el mecanismo de transparencia 


de inserción de ceros (bit stuffing). 





Nota 





El PPP especifica una variante orientada a carácter (los 
protocolos de la familia HDLC están orientados a bit), 
que es la que más se utiliza en enlaces por medio de 
módem (un contraejemplo serían las conexiones me- 


diante la RDSI). 


Lo importante es lo que transportan las tramas PPP. El mismo están- 
dar define la multiplexación de diferentes protocolos, que se distin- 
guirán por medio del campo Tipo. Los que nos interesan son los 


siguientes: 


e LCP (link control protocol): es el protocolo encargado de realizar 


el test del enlace, el control de la conexión y la gestión del enlace. 


e Protocolos de red: son tramas que encapsulan paquetes de ni- 
vel superior, como puede ser IP. Pero también pueden trans- 
portar NETBEUI, AppleTalk, Decnet, etc. 


e NCP (network control protocol): es el protocolo que se utiliza 
para tareas de gestión de los protocolos de red que transporta 
el enlace. En el caso del IP, permite que uno de los terminales 
asigne la dirección de Internet al otro y configure los diferentes 


parámetros de la red (direccionador, máscara, etc.) 





Figura 48. 











Encapsulamiento PPP 


Trama PPP 


16 bits 16 bits 


16 bits 


16 bits 





11.1.1. Compresión de las cabeceras 


Como ya hemos visto, la pirámide de PDU provoca ineficiencias en 
la transmisión, sobre todo en protocolos como Telnet, que con fre- 
cuencia envían bloques muy cortos de información. Asimismo, el PPP 
se ha utilizado en enlaces telefónicos que funcionan a velocidades 
máximas teóricas de entre 9.600 bps (módems norma V.32) y 
33.600 bps (módems norma V.34). Ello hace que dicha ineficiencia 


sea todavía más grave. 
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Nota 





Si se utiliza Telnet, para enviar un cardcter (de 1 byte) 
debemos enviar 8 + 20 + 20 + 1 = 49 bytes. Con 
un módem de 9.600 bps, si utilizáramos mensajes de 
8 bits de longitud más 1 bit de arranque y 1 bit de pa- 


rada, podríamos transmitir: 
9.600 / (1 + 8 + 1) = 960 caracteres/segundo. 


De hecho, nadie es capaz de mecanografiar tan rápi- 
do. Sin embargo, no debemos perder de vista que el 
enlace puede ser compartido por otras conexiones 


(transferencia de ficheros, consulta de la web, etc.). 








La compresión de cabeceras Van Jacobson mejora considerable- 
mente este problema. Este tipo de compresión se basa en el hecho 
de que en un acceso a Internet con PPP, en general no habrá dema- 
siadas conexiones TCP simultáneas. La compresión Van Jacobson 
permite mantener una tabla de hasta dieciséis conexiones simultáneas 
TCP/IP, a las que asignará dieciséis identificadores diferentes. Como la 
mayoría de los campos de las dos cabeceras TCP/IP no varían durante el 
transcurso de una misma conexión, basta con tener entre 3 y 5 bytes de 
cabecera para cada paquete (combinando PPP y TCP/IP) para mante- 
ner un funcionamiento correcto de la conexión. La ganancia en efi- 


ciencia de la transmisión es suficientemente importante. 


Para saber con exactitud qué ganancia se consigue, precisamos sa- 


ber qué longitud pueden tener las tramas PPP. 


Por medio del LCP también pueden obtenerse otras mejoras como, 


por ejemplo, la eliminación de los campos de control y de dirección. 


11.1.2. MTU 


Como ya hemos comentado, la mayoría de protocolos de nivel de 
enlace poseen una longitud máxima de transmisión, la MTU, que 
condiciona el tamaño de los paquetes de nivel superior que tanspor- 
ta. En el PPP, protocolo derivado del HDLC, no se trata de un valor 
concreto, sino que el límite vendrá fijado por la probabilidad de error 
en un bit que tengamos: cuanto más larga sea la trama, más proba- 


bilidad existe de que sea errónea. 


Sin embargo, existe un factor que limitará la MTU mds que los limites 
impuestos por los protocolos: el confort de la conexión. Se ha demos- 
trado que, en conexiones en tiempo real (como una conexión Telnet), el 
usuario debe recibir una reacción a sus acciones en una décima de 
segundo como máximo. retardos superiores provocan cansancio y 
dan la sensación de que “la máquina va lenta”, que todos hemos ex- 


perimentado alguna vez. 


Si pensamos que dentro de la misma conexión podemos tener mul- 
tiplexadas otras de transferencia (como FTP o web), nos encontrare- 
mos que los paquetes de las aplicaciones en tiempo real, que suelen 
ser cortos, deben esperarse detrás de los paquetes de longitud máxi- 
ma que se utilizan en las aplicaciones que tienen una tasa de trans- 
misión elevada (supondremos que los paquetes de la aplicación en 
tiempo real tienen preferencia sobre otros que previamente estuvie- 


ran en la cola de salida). 


La única manera de hacer que una aplicación estándar de transfe- 
rencia utilice paquetes más pequeños es reducir la MTU de la co- 
nexión. En el caso del PPP, si tomamos como referencia un módem 
de 33.600 bps, tenemos que un paquete de una décima de segundo 


de duración tendría los bytes siguientes: 
33.600 bps - (0,1 s) - (1 byte / 8 bits) = 420 bytes. 
En conexiones PPP tendremos, pues, la MTU entre 250 y 500 bytes. 


Con módems que dispongan de compresión, los valores que obten- 


dremos pueden aumentar. 





Nota 





Las velocidades de transmisión de los módems están- 
dar son 9.600 bps (V.32), 14.400 bps (V.32bis) y 
33.600 bps (V.34). 


En general, los módems disponen de dispositivos 
electrónicos para comprimir y descomprimir datos. 
Los estándares V.42bis y MNP9 realizan compresio- 
nes de hasta 1:4, con lo que pueden lograr velocida- 
des de transmisión efectiva de hasta 134.400 bps 
(V.34 + V.42bis) en situaciones favorables. 
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Hay módems (los que siguen el estándar V.90) que 
pueden lograr velocidades de hasta 56 kbps. En rea- 
lidad, no son módems en el sentido estricto, puesto 
que necesitan que en el otro extremo de la línea haya 


un codec conectado a una línea digital. 


| 11.2. Acceso ADSL 


Si bien el acceso a Internet por módem por medio de PPP ha sido 
la manera habitual de conexión por parte de los usuarios domés- 
ticos y las pequeñas empresas durante la primera “década Inter- 
net”, parece que ello cambiará y en la segunda “década Internet” 


se adoptarán sistemas que faciliten la conexión permanente. 





Nota 





La conexión por módem ocupa la línea de teléfono del 
abonado y, lo que todavía es peor, establece una lla- 


mada durante un tiempo indefinido. 


El ADSL representa una solución a este problema, puesto que, por un 
lado (aunque utiliza el cableado de la línea telefónica, el bucle de abo- 
nado), la línea telefónica queda libre para llamadas mientras se está 
conectado a Internet y, por otro, la conexión no consume recursos de 
la red telefónica, puesto que, cuando la señal llega a la centralita, se 


extrae del bucle de abonado y pasa a la red IP de la operadora. 





Figura 49. 
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En general, el direccionador que hay en el domicilio del usuario ofrece 
una conexión Ethernet equivalente a un concentrador, lo que permite que 


el abonado conecte más de un ordenador por medio de la línea ADSL. 


Para permitir que la línea telefónica conviva con la conexión a Inter- 
net permanente, se realiza una división del espectro: la parte baja 
continúa ocupada por el canal de voz (hasta 4 kHz) y, a partir de 
aquí, se sitúa el espectro de la codificación ADSL (con la limitación 
propia del par de hilos). El sistema es bidireccional: reserva el espec- 


tro bajo para la salida a la red, y el resto, para la entrada: 





Figura 50. 








Espectro de frecuencia ADSL 





Generalmente, no se puede llegar a los 1,1 MHz que indica la figura, 
puesto que la calidad del par de hilos es muy variable (clima, longi- 
tud, edad, etc.), por lo que se utiliza una codificación adaptativa: los 
dos sentidos del canal se dividen en subbandas de 4 kHz indepen- 
dientes (DMT, discrete multitone) que se codifican (en realidad, se 
modulan) con procedimientos casi idénticos a los utilizados por los 
módems tradicionales. Con ello, se consiguen treinta y dos canales 
de salida y hasta doscientos cintuenta y seis de entrada, con una ca- 
pacidad de 60 kbps cada uno de los mismos —modulados en QAM 
(quadrature amplitude modulation), como los módems telefónicos- 
que, acumulados, proporcionan un máximo de 15,36 Mbps de en- 
trada y 1,92 Mbps de salida. 


No obstante, las mejores conexiones no consiguen aprovechar correcta- 
mente los canales superiores y se considera que el límite máximo de sali- 
da es de 8 Mbps. Asimismo, las operadoras no suelen ofrecer conexiones 


tan rápidas, lo que hace que no se pueda lograr el límite teórico. 


Los protocolos utilizados dentro del ADSL dependen de la operadora 
y no están definidos por el estándar. Entre los posibles protocolos 


para el ADSL, tenemos el ATM y el mismo PPP. 
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Algunas operadores, para 


aprovechar mejor lineas ma- 


las, utilizan una variante del 
estándar que permite la 
transmision bidireccional con 
los dos canales en la misma 


banda. 


Esta solución, aunque nece- 
sita DCE más caros, permite 
aprovechar lineas con peo- 
res condiciones y/u obtener 
velocidades más altas. 
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| 11.3. Acceso LAN: el protocolo Ethernet 


Seguramente, la simplicidad de este protocolo de red, y no sus pres- 
taciones teóricas, ha hecho que sea el más utilizado en redes de área 
local prácticamente desde que DEC, Intel y Xerox establecieron un 
estándar (de facto) para LAN con control de acceso al medio CSMA/ 
CD, basándose en una arquitectura similar desarrollada los años se- 


tenta por Xerox. 








Nota 





Uno de los casos en el que una estación no rechaza 
las tramas con direcciones diferentes de la suya es 
cuando la estación configura la tarjeta de red en 
modo promiscuo. En este modo, la tarjeta inhabilita 
su capacidad de filtrado y lee todas las tramas que 
pasan por la red. Equipos que, generalmente, fun- 
cionan en este modo son los puentes (bridges, siste- 
mas destinados a la interconexión de LAN), los 
analizadores de tráfico (o analizadores de red) o los 
conmutadores (switches). No obstante, casi todas las 
tarjetas se pueden configurar en modo promiscuo, lo 
que con frecuencia es aprovechado por los ladrones 
de información (hackers) para leer y copiar informa- 
ción interesante que viaje por la LAN (principalmente 


contraseñas). 








11.3.1. Formato de la trama Ethernet 


La manera de conocer las principales caracteristicas de la trama 


Ethernet es ver los diferentes campos que la forman, que son los si- 


guientes: 


a) 


b) 


d) 





Figura 51. | 
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Preámbulo: está formado por 64 bits, alternativamente O y 1. Los 
dos últimos son 11. Ello genera una señal cuadrada que permite a 
los terminales sincronizar adecuadamente los relojes de sincronismo 
de bit. Los dos últimos bits señalan dónde empieza la trama (sincro- 
nismo de trama). Su forma es idéntica en todas las tramas. Nosotros 
obviaremos su presencia en el resto de la explicación, puesto que 


sólo son una señal para marcar el inicio de la trama. 


Dirección de origen: lleva la dirección física o dirección MAC del 
transmisor de la trama. Son 48 bits diferentes para cualquier ter- 


minal de la red Ethernet. 


Dirección de destino: lleva la dirección MAC del destinatario es- 
pecificada de la misma manera (en el mismo formato) que la di- 
rección de origen. En este caso, sin embargo, tenemos tres tipos 


de direcciones posibles: unicast, multicast y broadcast. 


Tipo: indica el tipo de contenido del campo de datos que lleva 
la trama (las tramas que transportan paquetes IP llevan un 
0x800). Permite multiplexar diferentes protocolos dentro de 
una misma LAN. Xerox actualiza regularmente la lista de pro- 
tocolos registrados (Xerox Public Ethernet Packet Type). Más 
adelante veremos las variedades de protocolos de Ethernet 
para conocer las variantes de Ethernet semicompatibles y saber 
cómo afecta su coexistencia a la manera como Ethernet ha te- 


nido que definir el campo Tipo. 
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Actividad 


Consultad la lista de los protocolos registrados para 
haceros una idea de la cantidad de protocolos de red 


(los superiores a Ethernet) que hay. 


e) Datos: se refiere al formato del campo de datos. Las restricciones 
sobre el tipo de datos que puede transportar Ethernet son las si- 


guientes: 


e La longitud de los datos debe ser múltiplo de 8 bits; es decir, 
Ethernet transporta la información en bytes. Ello no es ningún im- 
pedimento, puesto que los bits los envían sistemas que, por nor- 


ma general, trabajan con bytes o múltiplos de bytes. 


e Del mismo modo que PPP, Ethernet tiene limitada la longitud 
máxima de información transportable por la trama (MTU). En este 
caso, la MTU es de 1.500 bytes. Esta limitación tiene como obje- 


tivo evitar que una estación monopolice la LAN. 


e El campo de datos debe tener como mínimo 46 bytes de longi- 
tud (en Gygabit Ethernet, 512). Ello se debe al hecho de que es 
preciso que la trama mínima Ethernet tenga 64 bytes (512 bits). 
Se considera que las tramas inferiores son resultado de colisiones 


y son obviadas por los receptores. 


Este problema no se plantea en la variante de Ethernet IEEE802.3, 
puesto que este protocolo dispone de un campo de longitud y otro 
de relleno (padding) que permiten transmitir datos de hasta 1 byte de 
longitud, aunque la longitud que físicamente se transmite continúa 
siendo de 64 bytes. 





Actividad 


Imaginad qué sucedería si una estación quisiera en- 
viar un fichero de 1 GB por la LAN dentro de una sola 
trama. 


f) CRC: es un código de redundancia cíclica de 32 bits (CRC-32) 
para la detección de errores. Abarca toda la trama a excepción 


del preámbulo. Las tramas que no poseen un CRC correcto se ig- 
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noran (como las tramas de menos de 64 bytes y las que no son 
multiples de 8 bits). 





Nota 





Desde mediados de los años ochenta Ethernet ha convi- 
vido con una variante similar denominada IEEE802.3 o 
ISO8802.3. Son estándares establecidos por organiza- 
ciones reconocidas (el IEEE y la ISO) dedicadas a la nor- 
malización (estándar de iure). Durante un tiempo se 
pensó que el IEEE802.3 acabaría sustituyendo a la Ether- 
net original (también denominada Ethernet-DIX, en honor 
a DEC, Intel y Xerox), que no podía transmitir tramas ar- 
bitrariamente pequeñas. Los protocolos que trabajan so- 
bre Ethernet-DIX conocen esta limitación y llenan la 


trama hasta ocupar los 46 bytes de información. 


El IEEE802.3 introduce un campo de longitud (en la 
misma posición en que Ethernet tiene el campo de 
tipo) que permite saber cuántos bytes útiles contiene 
el campo de datos. Si la longitud no llega a los 46 
bytes mínimos, se llena con bytes (indefinidos) hasta 
llegar al mínimo. El receptor sólo debe leer el campo 
de longitud para extraer la información válida del 
mismo. El concepto de tipo de Ethernet (es decir, la 
coexistencia de diferentes protocolos por encima de 
Ethernet/IEEE802.3) se delega a un protocolo aso- 
ciado: el 1EEE802.2, protocolo de enlace que se 
puede utilizar en el IEEE802.3 y en otros protocolos 
de LAN y que posee unas funciones similares a las 
del HDLC. 





Figura 52. 
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Como en el nivel físico ambos estándares son totalmente 
compatibles, podríamos preguntarnos si pueden coexis- 
tir tramas Ethernet-DIX e 1EEE802.3 dentro de una 
misma LAN. La respuesta es que sí y que no al mis- 


mo tiempo. 


Fijaos en que todos los campos de la trama Ethernet 
y de la 802.3 son del mismo formato y significan lo 
mismo, a excepción del campo de tipo (Ethernet) y 
de longitud (802.3). Podríamos distinguirlos siempre 
que vigiláramos que ningún tipo Ethernet fuera equi- 
valente a una longitud válida de 802.3. Los tipos 
con valores inferiores a 1.500 (0x5DC en hexadeci- 


mal) pueden confundirse con longitudes válidas. 


Ello, obviamente, no podía tenerse en cuenta en la 
Ethernet-DIX original, puesto que es anterior al 
1EEE802.3. Por ello, apareció una adenda a la nor- 
ma Ethernet-DIX, conocida como Ethernet-DIX-II, 
que elimina los identificadores de protocolos por de- 
bajo de 0x0600 (1.536 en decimal). Hoy día con 
frecuencia dentro de una misma LAN encontramos 
tramas Ethernet-DIX-I| y tramas IEEE802.3. 


El IP puede ir sobre cualquiera de los dos estándares, 
aunque casi nadie elige la posibilidad de encapsularlo 
sobre el IEEE802.3. El par de protocolos IEEE802.3 + 
802.2 se utiliza en algunos de los sistemas operativos de 
red aparecidos en los años ochenta como, por ejemplo, 
el IPX de Novell y el NETBEUI de Microsoft. 








11.3.2. Tipos de medios físicos en Ethernet 


Ethernet se ha ido adaptando a las necesidades del tiempo am- 
pliando los subestándares de nivel físico. A continuación, mostra- 


mos una lista de los estándares más utilizados: 


e 10Base2: alcance de 185 m, ó 925 m con repetidores, pero 


con coaxial delgado, flexible y barato (por ello, durante mu- 


chos años esta red se ha denominado Cheapernet). aunque 
hoy día se tiende gradualmente a dejarlo de lado en favor de 
10BaseT —que es mucho más fiable—, millones de terminales en 
todo el mundo están conectados con Ethernet-10Base2. Se uti- 


liza sobre todo en topologías en bus. 


10BaseT: conexién en estrella de las estaciones a un nudo cen- 
tral (concentrador o hub) por medio de par trenzado; la distan- 
cia máxima de la estación al concentrador es de 100 m. La 
distancia máxima entre estaciones se consigue encadenando 


cuatro concentradores, y es de 500 m. 


Representa una mejora importante respecto a los estándares 
anteriores, puesto que se centralizan en un solo punto la ges- 
tión y la monitorización del estado de toda la LAN. Asimismo, 
con las topologías en bus, el mal funcionamiento de una esta- 
ción podía comportar el bloqueo de toda la red. Con 10BaseT, 
una mala conexión de un terminal es detectada por el concen- 
trador, que simplemente la desconecta e indica que el enlace 
a la estación está cortado o inactivo (con una luz roja, por 


ejemplo). 


10BaseF: similar a 10BaseT; sin embargo, en lugar de par 
trenzado, utiliza fibra óptica (generalmente, multimodo), con 


que se consigue un alcance mucho mayor (hasta 2 km). 


100BaseT y 100BaseF: similares a 10BaseT y 10BaseF, respec- 
tivamente; sin embargo, funcionan a 100 Mbps. A causa del 
protocolo de control de acceso al medio CSMA/CD, el alcance 
se reduce mucho (100 m entre estación y concentrador, sin po- 


sibilidad de encadenar concentradores). 


Gigabit Ethernet: las variantes más comunes son 1000BaseT, 
sobre cableado de cobre categoría 5 (equivalente al necesario 
para 100BaseT) y 1000BaseSX, sobre fibra. Tiene el mismo al- 
cance que 100BaseT, 100 m. 


10 Gigabit Ethernet: actualización de Ethernet para el siglo XXI 
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No es del todo cierto que el 
Unico grupo multicast Ethernet 
relevante sea el broadcast. La 


red Internet dispone del proto- 
colo IGMP (Internet group 
multicast protocol), que tam- 
bién trabaja sobre tramas 
Ethernet multicast. 
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11.3.3. Direcciones LAN 


Las direcciones LAN están divididas en diferentes campos, como 


puede observarse en la figura siguiente: 





Figura 53. 
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La mitad menos significativa de la dirección (los bits del 2 al 23), 
asignada por el IEEE a cada fabricante de manera fija, es el OUI 
(organizational unique identifier). Este último, cuando fabrica las 
tarjetas, programa (en ROM) la dirección completa, que está for- 
mada por el OUI mds una parte variable que el mismo fabricante 
asigna individualmente para cada tarjeta: la OUA (organizational 


unique address). 


Existen dos bits del OUI que siempre son cero cuando se trata de 
la dirección de origen: el bit multicast (M) y el bit local (L). Este úl- 
timo no se utiliza casi nunca y, por tanto, lo consideraremos siem- 


pre cero. 


Tanto la dirección de destino como la de origen de la trama tienen 
el mismo formato, con la única diferencia de que la dirección de 
destino también puede ser de tipo multicast (bit M=1). En este caso, 
el número que lleva no se refiere a una estación en particular, sino 


que se dirige a un grupo de estaciones. Cada una de las cuales co- 


noce el grupo o grupos a los que está adscrita. Por norma general, 
cada uno de los grupos se refiere a grupos de estaciones que com- 
parten una misma aplicación o un mismo protocolo. En el IP, el úni- 


co grupo multicast Ethernet relevante es el broadcast. 


Sobre papel, las direcciones LAN se escriben en hexadecimal, sepa- 
rando los bytes con dos puntos y escribiendo primero el byte menos 


significativo, por ejemplo: 


08:00:00:10:97:00 


El primer byte (que es el menos significativo) es siempre divisible por 


cuatro en direcciones no multicast que tienen los bits My La 0. 


El grupo broadcast es especial, en el sentido de que, por defecto, to- 
das las estaciones le pertenecen; por tanto, es una manera de difun- 
dir información simultáneamente a todas las estaciones. El concepto 
de broadcast no es exclusivo de Ethernet, sino que es común a mu- 
chos otros protocolos de LAN y WAN (también en el IP). Poner todos 
los bits de la dirección a 1 constituye la manera más habitual de re- 
presentar la dirección broadcast, y es la que utilizan las LAN 
(FF:FF:FF:FF:FF:FF). 
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| 12. Protocolos del nivel de transporte 


El objetivo principal del nivel de transporte es establecer una comunica- 
ción extremo a extremo a través de una red. En otras palabras, actuar 
de interfaz entre los niveles orientados a la aplicación y los niveles orien- 


tados a la red de la jerarquía de protocolos (tanto OSI como TCP/IP). 


El nivel de transporte oculta a los niveles altos del sistema el tipo de tec- 
nología (red) al que está conectado el terminal. La figura siguiente des- 
cribe el posicionamiento del nivel de transporte respecto al resto de los 


niveles: 





Figura 54. 





4- Dirección IP 





En este apartado nos interesan los dos protocolos del nivel de trans- 
porte que se definen en la pila TCP/IP: UDP y TCP. UDP es no orien- 


tado a la conexión, mientras que TCP es orientado a la conexión. 


En el nivel de transporte se definen dos direcciones que lo relacionan 


con los niveles superior e inferior: 


* La dirección IP, que ya conocemos, es la dirección que identifica 


un subsistema dentro de una red. 


+ El puerto identifica la aplicación que requiere la comunicación. 
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Para identificar las diferentes aplicaciones, los protocolos TCP/IP 
marcan cada paquete (o unidad de información) con un identificador 


de 16 bits llamado puerto. 


La verdadera utilidad de los puertos es que permiten multiplexar 
aplicaciones sobre protocolos del nivel de transporte. Ello signi- 
fica que un mismo protocolo de transporte lleva información de 
diferentes aplicaciones y estas últimas son identificadas por el 


puerto. 


Si alguna aplicación que corre en un terminal quiere establecer una 
comunicación con un servidor o con otro terminal, debe utilizar un 
protocolo de transporte: el TCP o el UDP. Como el destino puede 
encontrarse en una red remota, los protocolos de transporte nece- 
sitan el protocolo Internet para poder llegar al terminal o servidor 


remoto. 








Figura 55. 
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Como podéis observar en la figura anterior, las aplicaciones utilizan 
uno de los dos protocolos de transporte para comunicarse con equi- 
pos remotos. Para que un protocolo de aplicación se pueda comuni- 
car con otro del mismo nivel situado en un terminal remoto, debe 
transmitirle un flujo de bytes que es encapsulado por los protocolos 


del nivel de transporte. 





En general, dos aplicaciones se comunican siguiendo el modelo 
cliente/servidor. En una conexión es típico que una aplicación (el 
cliente) inicie una comunicación pidiendo una información a otra 
aplicación (el servidor). Pensemos en un ordenador que esté conec- 
tado a una LAN y tenga asignada una dirección IP. Supongamos 
que dicho ordenador actúa como servidor de correo electrónico, 
además de como servidor de nombres. Un cliente conectado a Inter- 
net que solicita resolver un nombre necesita conocer la dirección IP 
asignada a este ordenador y el puerto que identifica la aplicación 


servidor que resuelve nombres. 


El cliente necesita conocer ambas direcciones puesto que el servidor 
estará conectado a una red y, por tanto, tendrá una dirección IP que 
debe ser conocida para que se pueda establecer una comunicación 
con esta máquina remota. Dicha comunicación se consigue por 
medio del IP. Sin embargo, una vez conseguida, el servidor debe 
ser capaz de identificar la aplicación con que desea comunicarse el 
cliente entre las muchas que corren: servidor de nombres, servidor 


de correo electrónico, etc. 


El cliente conoce la dirección IP de origen (la suya), la dirección IP de 
destino (la del servidor) y su puerto de origen (identifica la aplicación 
cliente). Sin embargo, también debe conocer el número (puerto de 
destino) que identifica la aplicación deseada en el servidor, y lo hace 


por medio de los llamados puertos conocidos (well-known port). 
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Veremos el modelo cliente/ 
servidor en la unidad 15. 
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Ejemplo 


Los valores de puertos conocidos para aplicaciones 
que utilizan el UDP son los siguientes: 


e Puerto 7 para el servidor de eco. 

e Puerto 53 para el servidor de nombres (DNS, domain 
name server). 

e Puerto 69 para el protocolo de transferencia de fi- 


cheros trivial (TFTP, trivial file transfer protocol). 


Y algunos valores de puertos conocidos para aplicacio- 


nes que utilizan el TCP son los siguientes: 


e Puertos 20 y 21 para el protocolo de transferencia 
de ficheros, FTP de datos y de control respectiva- 
mente. 

e Puerto 23 para el Telnet Remote Login. 

e Puerto 80 para el HTTP. 





Evidentemente, el servidor no necesita conocer a priori el puerto de 
origen, puesto que se limita a responder a cualquier petición de cual- 
quier cliente. Este último informa en la unidad de datos de protocolo 
(PDU) del nivel de transporte (o bien un datagrama UDP, o bien un 
segmento TCP) de los puertos de origen y de destino, de manera que 
el servidor conocerá el puerto de origen una vez haya recibido una 


petición. 


| 13. El UDP (user datagram protocol) 


El UDP es un protocolo no orientado a la conexión, de manera que 
no proporciona ningún tipo de control de errores ni de flujo, aunque 
utiliza mecanismos de detección de errores. En caso de detectar un 
error, el UDP no entrega el datagrama a la aplicación, sino que lo 
descarta. Conviene recordar que, por debajo, el UDP está utilizando 
el IP, que también es un protocolo no orientado a la conexión. Las 


características más importantes del UDP son las siguientes: 


e No garantiza la fiabilidad; es decir, no ofrece la seguridad de que 
cada datagrama UDP transmitido llegue a su destino; es un protoco- 
lo best-effort: el UDP hace todo lo posible para transferir los datagra- 


mas de su aplicación, pero no garantiza su entrega. 


+ No preserva la secuencia de la información que le proporciona la 
aplicación. Como está en modo datagrama y utiliza un protocolo 
por debajo como el IP, que también está en modo datagrama, la 
aplicación puede recibir la información desordenada. La aplicación 
debe estar preparada para que haya datagramas que se pierdan, 


lleguen con retardo o se hayan desordenado. 





Figura 56. 
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El UDP es un protocolo no 
orientado a la conexión. 


Ello significa que cada da- 
tagrama UDP existe con in- 
dependencia del resto de 
los datagramas UDP. 





Hay muchas aplicaciones 
que limitan la medida de 
sus buffers de transmisión y 
recepción por debajo de la 
medida máxima de un da- 
tagrama UDP. Por ejemplo, 
es tipico encontrar aplica- 
ciones que proporcionan, 
por defecto, medidas máxi- 
mas del datagrama UDP de 
8.192 bytes. Este valor pro- 
viene de la cantidad de da- 
tos del usuario que el NFS 
(network file system) puede 


leer o escribir por defecto. 
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La figura anterior muestra la unidad de datos del protocolo UDP y su 
encapsulamiento en un paquete IP. Cada operación de salida de un 


datagrama UDP provoca la generación de un paquete IP. 


El datagrama UDP consta de una cabecera y un cuerpo para encap- 


sular los datos. La cabecera consta de los elementos siguientes: 


e Los campos Puerto de origen y Puerto de destino, que identifi- 
can las aplicaciones en los terminales de origen y de destino. 


Cada puerto tiene 16 bits. 


+ El campo Longitud indica la longitud, en bytes, del datagrama 
UDP incluyendo la cabecera UDP (es la diferencia de la longitud 
del datagrama IP menos la cabecera IP). Como la longitud máxi- 
ma de un datagrama IP es de 65.535 bytes, con una cabecera es- 
tándar de 20 bytes, la longitud máxima de un datagrama UDP es 
de 65.515 bytes. 


e El campo Checksum (16 bits) es opcional y protege tanto la ca- 
becera como los datos UDP (es preciso recordar que el checksum 
del datagrama IP sólo cubre la cabecera IP). Cuando el UDP re- 
cibe un datagrama y determina que hay errores, lo descarta y no 


lo entrega a ninguna aplicación. 





Nota 





El cálculo del checksum en el UDP es muy parecido al 
cálculo del checksum en el IP (Suma en complemento 
a 1 de palabras de 16 bits), con la particularidad de 
que la longitud del datagrama UDP puede ser par o 
impar. En caso de que sea impar, se le añade un O al 
final del datagrama para calcular el checksum (este O 
no se transmite). Para calcular el checksum, el UDP uti- 
liza una seudocabecera de 12 bytes con algunos de 
los campos IP. Esta última no se transmite; el UDP sólo 
la utiliza para calcular el checksum y le sirve para com- 
probar que la información que le proporciona el IP sea 


realmente para él. 











Las aplicaciones que no requeiren de la funcionalidad del TCP, usan 
el UDP como protocolo de trasporte. Podemos poner dos ejemplos 


de estas aplicaciones: 


e Aplicaciones en tiempo real. Estas aplicaciones requieren poco re- 
tardo (mejor dicho, poca variabilidad en el retardo), y TCP puede 
introducir retardos considerables si tiene que esperar, por ejem- 


plo que le llegue un paquete que se ha perdido. 


e Aplicaciones interesadas en transmitir información en modo 
multicast o broadcast (a un grupo de usuarios o a todos los de 
una red). En este caso, no tiene sentido establecer una conexión 


como hace el TCP con cada una de las estaciones destino. 
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| 14. El TCP (transmission control protocol) 


Como hemos podido observar, el UDP no garantiza la entrega de la 
información que le proporciona una aplicación. Tampoco reordena 
la información en caso de que llegue en un orden diferente de aquél 
en que se ha transmitido. Existen aplicaciones que no pueden tolerar 
dichas limitaciones. Para superarlas, el nivel de transporte proporcio- 


na un protocolo llamado TOP. 


El TCP proporciona fiabilidad a la aplicación; es decir, garantiza la 
entrega de toda la información en el mismo orden en que ha sido 
transmitida por la aplicación de origen. Para conseguir esta fiabili- 
dad, el TCP proporciona un servicio orientado a la conexión con un 


control de flujo y errores. 


| 14.1. El TCP proporciona fiabilidad 


Para proporcionar un servicio fiable a la aplicación, el TCP se basa 


en los principios siguientes: 


1) Transmisión libre de error. El TCP debe entregar a la aplica- 
ción de destino exactamente la misma información que le en- 
tregó la aplicación de origen. De hecho, se trata de una 
entrega “casi libre” de errores, puesto que puede haber algu- 
nos que un mecanismo de detección de errores no pueda de- 


tectar. 


2) Garantía de entrega de la información. El TCP garantiza que 
toda la información transmitida por la aplicación de origen se 
entregue a la aplicación de destino. Si no es posible, el TCP 


debe avisar a la aplicación. 
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3) 


4) 


Garantía de mantenimiento de la secuencia de transmisión. 
El TCP garantiza la entrega del flujo de información en el mis- 


mo orden en que le fue entregado por la aplicación de origen. 


Eliminación de duplicados. El TCP garantiza que sólo entregará 
una copia de la información transmitida a la aplicación de desti- 
no. En caso de que reciba copias a causa del funcionamiento de 
la red o de los protocolos que se implementan por debajo del ni- 


vel de transporte, el TCP las eliminará. 


La fiabilidad de la transmisión que proporciona TCP se consigue gra- 


cias a las siguientes estrategias: 


El TCP está orientado a la conexión: tiene una fase de estable- 
cimiento de la conexión, una de transmisión de datos y una de 


desconexión. 


El TCP utiliza el concepto buffered transfer: cuando se transfiere 
información, el TCP divide los flujos de datos (byte stream) que 
le pasa la aplicación en segmentos del tamaño que le conven- 
ga. El TCP decide el tamaño de los segmentos tanto si la apli- 
cación genera un byte de información, como si genera flujos 
de grandes dimensiones. En el primer caso, el TCP puede es- 
perar a que la memoria intermedia se llene más antes de trans- 
ferir la información, o bien la puede transferir de inmediato 
(mecanismo push). En caso de que los flujos sean muy grandes, 
el TCP puede dividir la información en tamaños más pequeños 


antes de transferirlos. 


El TCP utiliza una conexión full duplex: la transferencia de in- 
formación es en ambos sentidos. La aplicación ve dos flujos in- 
dependientes. En caso de que la aplicación cierre uno de los 
flujos, la conexión pasa a ser half duplex. Ello significa que uno 
de los extremos (el que no ha cerrado la conexión) puede con- 
tinuar enviando información por el canal, mientras que el otro 
extremo (el que ha cerrado la conexión) se limita a reconocer 
la información. No obstante, no es normal encontrar este caso. 
Lo más habitual es que, si un extremo cierra la conexión, el 


otro también la cierre. 


| 14.2. Formato del segmento TCP 


La unidad de información del protocolo TCP se llama segmento TCP 


y su formato el siguiente: 





Figura 57. 











Paquete IP 


MA | 


Cabecera Datos 


Segmento 0 y 


Puerto de origen: 16 bits Control: 6 bits 

Puerto de destino: 16 bits Ventana: 16 bits 
Numero de secuencia; 32 bits ) Cheksum: 16 bits 
NUEVAS II IA O 
Longitud de la cabecera: 4 bits ) Opciones TCP: 32 bits 
Reservado: 6 bits 





El segmento TCP consta de una cabecera y un cuerpo para encapsu- 


lar datos. La cabecera consta de los campos siguientes: 


a) El campo Puerto de origen identifica la aplicacién en el terminal 
de origen. 





Figura 58. 











Segmento TCP 


Cabecera 


Puerto de origen: 16 bits 
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b) El campo Puerto de destino identifica la aplicación en el terminal 
de destino. 





Figura 59. 








Segmento TCP 


— ~~ | 


Cobecera 


Puerto de destino: 16 bits 





c) El campo Número de secuencia identifica el primer byte del cam- 
po de datos. En el TCP no se numeran segmentos, sino bytes. Por 
tanto, el número de secuencia identifica el primer byte de los datos 
que envía el segmento: al principio de la conexión se asigna un nú- 
mero de secuencia inicial (ISN, del inglés initial sequence number), 


a partir del cual el TCP numera los bytes consecutivamente. 





Figura 60. 








Segmento ¡(A 
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[eles era 


Número de secuencia: 32 bits 





d) El campo Número ACK. El TCP reconoce datos por medio de la 
técnica de piggybacking. Al activar un bit de la cabecera (el bit 
ACK), el TCP tiene en cuenta el número de secuencia ACK que in- 
dica al otro extremo TCP el próximo byte que está dispuesto a re- 
cibir. Dicho de otra manera, el número ACK menos uno indica el 


último byte reconocido. 





Figura 61. 
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e) El campo Longitud de la cabecera indica la longitud de la cabe- 
cera, que puede ser variable. La longitud tipica es de 20 bytes; sin 
embargo, si el TCP utiliza el campo de opciones, puede llegar a 
una longitud mdxima de 60 bytes. De este modo, el TCP sabe 


dónde empiezan los datos. 





Figura 62. 
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f) El campo Reservado, tal como su nombre indica, está reservado 


y se inicializa con ceros. 








Figura 63. 





Segmento TCP 


| 


Lele alae) 
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g) El campo Control está formado por seis indicadores indepen- 
dientes, cada uno de los cuales señala una función específica del 


protocolo cuando está activo (a 1): 





Figura 64. 








Segmento TCP 


a 


Cabec ora 


Control: 6 bits 





e URG: indica que hay datos urgentes (y el campo Urgent pointer 


indica la cantidad de datos urgentes existentes en el segmento). 
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e ACK: cuando este bit está activo, el campo Número ACK indica el 
byte siguiente que espera recibir la conexión TCP. Si este bit no 
está activo, el campo Número ACK no tiene ningún significado 
para el TCP. 


¢ PSH: invoca la función push en el protocolo. Esta función dice al 


receptor que entregue a la aplicación todos los datos que tenga 


No debe confundirse PSH 
con el indicador URG, que 


disponibles en la memoria intermedia de recepción sin esperar 


indica que la aplicacién ha a completarlos con datos adicionales. De este modo, los datos 
señalado una porción del 


no esperan en la memoria intermedia receptora hasta completar 
segmento como urgente. 





un segmento de dimensión máxima. 


e RST: realiza un reset de la conexión. 


e SYN: se utiliza para iniciar una conexión y también sirve para re- 


sincronizar los números de secuencia. 


e FIN: indica que el transmisor ha acabado la conexión. 


h) El campo Ventana indica cuántos bytes componen la ventana de 
transmisión del protocolo de control de flujo por ventana desli- 
zante. A diferencia de los protocolos del nivel de enlace, en que 
la ventana era constante y contaba tramas, en el TCP la ventana 
es variable y cuenta bytes. Con cada segmento transmitido, un ex- 
tremo TCP advierte al otro extremo de la cantidad de datos que 
está dispuesto a recibir en cada momento. De este modo, el ex- 
tremo que recibe un segmento actualiza el tamaño de su ventana 


de transmisión. 





| Figura 65. 





Ventana: 16 bits 
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i) El campo Checksum se utiliza para detectar errores. 








Figura 66. 
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Cabecera 


Checksum: 16 bits 


j) El campo Urgent pointer tiene sentido cuando el bit de control 
URG está activo. Indica que los datos que envía el origen son ur- 
gentes e identifica el último byte de dicho campo. La aplicación es 
la que indica que estos últimos son urgentes y lo sabe porque el 
TCP se lo indica en la recepción. 





Figura 67. 
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Nota 





Algunas aplicaciones que utilizan el Urgent pointer 
son, por ejemplo telnet, rlogino ftp. En la libre- 
ría de sockets, el tráfico urgente se denomina tráfico 
fuera de banda (out of band). 


k) El campo Opciones TCP permite añadir campos a la cabecera 


para realizar las operaciones siguientes: 





Figura 68. 





Segmento TCP 


Opciones: 32 bits 
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Si el número de secuencia 
indica 1.000 y el urgent po- 
inter indica 200, significa 


que los bytes del 1.000 al 
1.200 se consideran urgen- 
tes. A partir del byte 1.201 
los datos se vuelven a consi- 


derar normales. 





e Marcar el tiempo (timestamp) en que se transmitió el segmento y 


de este modo poder monitorizar los retardos que experimentan 


El tamaño máximo del seg- 
mento TCP transmitido se 
especifica durante el esta- 


los segmentos desde el origen hasta el destino. 


blecimiento de la conexi6n y e Aumentar el tamaño de la ventana. 
define la máxima longitud 


de datos que enviará el e Indicar el tamaño máximo del segmento (MSS, del inglés maxi- 
TER: 





mum segment size) que el origen está preparado para recibir. 
Por tanto, el receptor no le puede transmitir segmentos por en- 


cima de este valor. 





Actividad 


¿Cuál es el tamaño de un datagrama IP en función de 
MSS? 


Solución 


Si el tamaño de los datos TCP es MSS, será preciso aña- 
dirle 20 bytes de la cabecera TCP más 20 bytes de la ca- 
becera IP (teniendo en cuenta las cabeceras básicas sin 
opciones). Ello significa que la longitud del datagrama IP 
serd de MSS + 40 bytes (siempre asumiendo que tanto el 


TCP como el IP no utilizan sus campos de opciones). 


Si no se especifica el tamaño máximo durante la transmi- 
sión del segmento SYN, se toman por defecto 536 bytes 
(el tamaño por defecto de un datagrama IP es de 576 
bytes, menos los 40 bytes de las cabeceras IP y TCP). 





El hecho de elegir el MSS no es trivial. En general, cuanto mayor sea 







el MSS, mejor, puesto que las cabeceras IP y TCP se amortizan más. 





Consultad la MTU en el 


A IVA Sin embargo, si la MTU es pequeña, será preciso fragmentar el da- 





tagrama IP (es decir, el segmento TCP); por tanto, por norma general 
no interesa elegir MSS mayores que la MTU. En este caso, existen di- 


ferentes posibilidades: 


1) Buscar la MTU local de la red a que está conectada la estación y, 


si hay MTU más pequeñas hasta el destino, habrá fragmentación. 


2) Utilizar MTU discocvery path, un mecanismo de búsqueda para ave- 
riguar cuál es la MTU menor desde el origen hasta el destino y utilizar 


como MSS esta ultima menos los 40 bytes de cabeceras IP y TCP. 
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| 14.3. Establecimiento de la conexión 


Para establecer una conexión, el TCP utiliza el protocolo three-way 
handshake. Este último necesita tres segmentos TCP para poder es- 


tablecer la conexión. 


Consideremos que el servidor está en un estado de escucha, llamado 
listen, y que el cliente quiere establecer una conexión con el servidor. 
El TCP de la máquina cliente iniciará la petición de conexión TCP, 


que será contestada por el TCP de la máquina servidor. 





Figura 69. 
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Sn al A N 
Hi] reconocimiento 


Para que el cliente TCP pueda establecer una conexión TCP con el 


servidor, se siguen los pasos siguientes: 


1) Petición de la conexión 


El TCP cliente envía un segmento de petición de conexión al servidor. 
Dicho segmento, que se conoce como segmento SYN porque tiene 
activado el bit SYN en el campo Control de la cabecera del segmento 


TCP, especifica el número de secuencia inicial TCP del cliente (ISN). 


El número de secuencia inicial se elige al azar. La razón es muy sen- 
cilla. Hay paquetes que pueden sobrevivir en la red una vez se ha ce- 


rrado la conexión TCP (incluso si ha sido a causa de una caída del 





143 


El segmento SYN especifica 
más parámetros, tales como 
el puerto del servidor al que 


se quiere conectar el cliente, y 
suele especificar también la 
medida máxima del segmen- 
to (MSS) que el cliente trans- 
mitird. 
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sistema). Es preciso asegurarse de que una conexión nueva elige un 
número de secuencia inicial que no exista. El TCP recomienda utilizar 
un número de secuencia inicial basado en una variable que se incre- 
menta una cantidad x cada y tiempo (por ejemplo, en 4.4BSD hay 


un contador que se incrementa cada 8 ms). 


Si el sistema cae, pasados unos segundos vuelve a estar en funcio- 
namiento e inmediatamente se establece una conexión nueva utili- 
zando el mismo puerto y la misma dirección IP, se podría interpretar 
que los segmentos TCP que han quedado retrasados en la red y que 
ya existían con anterioridad a la caída de la máquina, pertenecen a 
la conexión nueva, lo que provocaría la confusión y el mal funciona- 
miento de dicha conexión. Ello sucedería incluso con independencia 


del número de secuencia inicial elegido. 


Con el objetivo de protegerse de esta situación, se combinan dos téc- 
nicas: una consiste en elegir el número de secuencia inicial de ma- 
nera aleatoria y la otra es el denominado quiet time, que consiste en 
que el TCP no crea ninguna conexión nueva después de un rebote de 
máquinas hasta que no transcurre un tiempo determinado denomi- 
nado MSL (del inglés maximum segment lifetime: “tiempo máximo de 
vida de un segmento”). De este modo, se asegura de que no recibirá 


segmentos antiguos de otras conexiones. 





Nota 





El MSL depende de la implementación; sin embargo, 
los valores normales son, aproximadamente, de 30 
segundos, 1 minuto ó 2 minutos. No obstante, existen 
muchas implementaciones que no tienen en cuenta 
esta situación, puesto que consideran que un rebote 


de máquinas dura más tiempo que el MSL. 





2) Confirmación de la conexión 


El servidor responde a la petición de establecimiento de la conexión con 


un segmento SYN que indica el número de secuencia inicial que utilizará. 


Asimismo, este segmento contiene un reconocimiento (ACK) del seg- 
mento SYN del cliente que indica el ISN del cliente más 1 (el número 


de secuencia inicial del cliente más 1). 





Nota 





Conviene recordar que el TCP numera los ACK con el 
número de secuencia del próximo byte que espera re- 
cibir (en este caso, el servidor espera que el próximo 
byte enviado por el cliente sea J + 1). En la figura an- 
terior, sería el segmento SYN (K), ACK (J + 1), donde 
K es el ISN elegido por el TCP servidor. 





3) Reconocimiento de la conexión 


El cliente reconoce el segmento SYN (K) del servidor con un recono- 
cimiento que contiene el ISN servidor más 1. En la figura anterior, se- 


ría el segmento ACK (K + 1). 


Se dice que quien envía el primer segmento SYN (en este caso, el 
cliente) efectúa una apertura activa (active open), mientras que quien 
recibe el primer segmento SYN y envía el próximo segmento SYN (en 
este caso, el servidor) lleva a cabo una apertura pasiva (passive 


open). 


Puede darse el caso de que ambos extremos efectúen una apertura 
activa en el mismo momento. Esta situación se denomina apertura si- 


multánea (simultaneous open). 


Después de estos tres pasos, podemos decir que ya se ha estable- 


cido la conexión entre el cliente y el servidor. 





Nota 





Utilizaremos el programa tcpdump para ver cómo 
funciona el protocolo de establecimiento de una co- 


nexión. 


Asumimos que nos hemos conectado a una máqui- 
na llamada argos y hacemos un rlogin a la má- 


quina helios 


o 


argos % rlogin helios 
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En el anexo 2 podéis encon- 


trar una descripción del pro- 
grama tcpdump. 
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Las primeras lineas que obtenemos con el tcpdump son las si- 


guientes: 


+ 15:56:54.796091 argos.1023 > helios.login: S 3541904332: 3541904332 
(0) win 31744 <mss 1460> 


+ 15:56:54.796091 helios.login > argos.1023: S 548133143: 548133143 
(0) ack 33541904333 win 8760 <mss 1460> 


+ 15:56:54.796091 argos.1023 > helios.login: . ack 548133144 win 31744 





Interpretación 





1) argos, desde el puerto 1.023, envía a helios una 
petición de conexión por medio de un segmento 
SYN. El número de secuencia inicial (ISN) elegido 
por argos es el 3.541.904.332, y argos anuncia 
que puede recibir 31.744 bytes sin reconocerlos y 
que espera recibir segmentos con un tamaño máxi- 


mo de 1.460 bytes. 


2) helios responde con un segmento SYN eligiendo 
como ISN el número 548.133.143 y responde con un 
ACK con el byte siguiente que espera recibir de argos, 
el 3.541.904.333 (3.541.904.332 + 1). Anuncia 
que puede recibir 8.760 bytes y que espera recibir 


segmentos con un tamaño máximo de 1.460 bytes. 


3) argos reconoce el segmento SYN con un segmento 
en el que espera recibir el byte 548.133.144 
(548.133.143 + 1), argos vuelve a advertir que 
está dispuesto a recibir hasta 31.744 bytes. 








A continuación, empezaría el intercambio de información entre el 
cliente y el servidor (por ejempo peticiones de login, contraseña, 


prompt de la máquina, etc.). 





Actividad 


Utilizad el programa tcpdump para ver el estableci- 
miento de una conexión. Con esta finalidad, estable- 
ced una conexión con aplicaciones diferentes (telnet, 
ftp, rlogin, etc.) y monitorizad la conexión. Obser- 
vad los segmentos de inicio de la conexión, el valor del 
número de secuencia inicial, el del número ACK inicial 


y el tamaño de la ventana. 





| 14.4. Terminación de la conexión 


Cuando la transferencia de la información ha finalizado, el TCP dis- 


pone de un protocolo de terminación de la conexión para cerrarla. 


En una conexión TCP full duplex, en la que los datos fluyen en ambos 
sentidos, independientes el uno del otro, cualquier conexión debe ce- 


rrarse independientemente. 


Es preciso tener en cuenta que tanto el cliente como el servidor pue- 
den cerrar la conexión. Sin embargo, la situación normal es que la 
aplicación cliente inicie la petición de conexión y tenga, posiblemen- 
te, un usuario interactivo que le pida su cierre por medio, por ejem- 
plo, de una instrucción, que en telnet sería 1ogout y en un ftp sería 
bye. Por tanto, supongamos que es el cliente quien pide cerrar la co- 
nexión (si fuera el servidor, sería similar). Los pasos que se siguen son 


los siguientes: 


1) El cliente envía un segmento TCP del tipo FIN con el número de 
secuencia correspondiente (J). Ello significa que a partir de este 
momento no habrá más datos que fluyan en este sentido (cliente 


> servidor). 


2) El servidor envía una confirmación del cierre por medio de un 


ACK con el número de secuencia recibido más 1 (J + 1). 


El TCP servidor indica a su aplicación que el cliente cierra la conexión. 


La aplicación servidor indica a su TCP que la cierre a continuación. 


3) El servidor envía un segmento TCP del tipo FIN al cliente con el 


número de secuencia correspondiente (K). 


4) EI TCP cliente responde automáticamente con un ACK (K + 1). 
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El segmento FIN recibe este 
nombre porque tiene acti- 


vado el bit FIN en el campo 
Control de la cabecera del 
segmento TCP. 





Lectura complementaria 


Podéis encontrar una sec- 
ción dedicada a este tema 
en el libro: 


W.R. Stevens (1998). 
TCP/IP Illustrated (vol. 1: 
“The Protocols”, cap. 19, 
pág. 252). Wilmington: 
Addison-Wesley, 1994. 
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La conexión que efectúa el cierre activo entra en un estado denomi- 
nado TIME_WAIT, de manera que deberá esperar un tiempo (por 
norma general, una o dos veces el MSL) antes de utilizar de nuevo el 
mismo puerto. Lo más habitual es que sea el cliente quien efectúe el 
cierre activo. Como los clientes suelen utilizar puertos locales efíme- 
ros, este tiempo de espera no les afecta. En cambio, si es el servidor 
quien efectúa el cierre activo, podemos encontrarnos con que no se 
pueda reinicializar durante 1 6 2 minutos. Ello sucede porque el ser- 
vidor utiliza puertos conocidos que no se pueden volver a reasignar 
hasta que no acabe el procedimiento quiet time y se salga del estado 
TIME_WAIT. 


Es posible que sólo cierre la conexión (salida de datos) uno de los ex- 
tremos, mientras que el otro (recepción) se mantiene abierto. Esta situa- 
ción se denomina half-close, pero hay pocas aplicaciones que se 
aprovechen de ella. Lo más normal es que ambas aplicaciones cie- 
rren sus canales de comunicaciones. Asimismo, puede darse el caso 
de que dos extremos efectúen un cierre activo. Esta situación se de- 


nomina cierre simultáneo (simultaneous close). 


Monitorización de la terminación de una conexión utilizando el 


programa tcpdump 


Utilizaremos el comando tcpdump para ver cómo funciona el pro- 
tocolo de terminación de la conexión. Asumimos que en el rlogin del 
ejemplo de establecimiento de la conexión helios hace un logout 


(pide el cierre de la conexión). 


o 


helios % logout 
Las lineas que obtenemos con el tcpdump son las siguientes: 
15:57:01.616091 helios.login > argos.1023: F 1417: 1417 (0) 


ack 41 win 8760 


15:57:01.616091 argos.1023 > helios.login: .ack 1418 win 
31744 


15:57:01.616091 argos.1023 > helis.login: F 41:41 (0) ack 
580 31744 


15:57:01.616091 helios.login > argos.1023: .ack 42 win 8760 





Interpretación 





1) helios envía un segmento con el indicador F (FIN). La notación de los números 


k . x de secuencia números 
El número de secuencia es el 1.417 y envía O bytes y 


ACK se establece a partir 


de datos. Espera recibir el byte 41 de argos y ad- del ISN; es decir un número 


vierte una ventana de 8.760 bytes. de secuencia 1.417 indica 


, un número de secuencia 
argos envía un reconocimiento por medio de un ISN+1.417. 


segmento con ACK 1.418 (1.417 + 1) y advierte 
una ventana de 31.744 bytes. 


2 


— 





3 


— 


Ahora le toca a argos cerrar su conexión TCP. Con 
esta finalidad, envía un segmento con el indicador 
F (FIN) a helios. El número de secuencia es el 41 (es 
el que esperará helios) y envía O bytes de datos. 
Advierte una ventana de 31.744 bytes. 

4 


— 


helios recibe el segmento, lo reconoce con el ACK 
numerado como 42 (41 + 1) y advierte una venta- 
na de 8.760 bytes. 


helios ha efectuado un cierre activo, mientras que argos 


ha efectuado un cierre pasivo. 











Actividad 
Utilizad el programa tcpdump para ver el cierre de una 
conexión. Con esta finalidad, estableced una conexión 


con diferentes aplicaciones (telnet, rlogin, etc.) y su- 





pervisadla. 


| 14.5. Diagrama de estados del TCP 


En el diagrama de estados del TCP se describen los diferentes esta- 


Lectura complementaria 


dos por los que pasa una conexión desde su establecimiento hasta 
, ze y . f W.R. Stevens (1998). “The 
su terminación, incluyendo la etapa de transferencia de la informa- Protocols” TCP/IP Illustrated 


ción. Los nombres de los estados TCP son los mismos que se pueden (vol. 1). Wilmington: 
Addison-Wesley, 1994. 





consultar con la llamada al sistema netstat. 


El estado ESTABLISHED se corresponde con la transferencia de la in- 
formación. El resto de los estados se corresponden con el estableci- 
miento y la terminación de la conexión, teniendo en cuenta todas las 


maneras posibles de establecer y cerrar una conexión en el TCP. Los 
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Consultad el MSL en el apar- 
tado 15.3 de esta unidad. 
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simbolos SYN, RST, FIN y ACK se corresponden con los bits de indi- 


cación de la cabecera TCP. 





Figura 70. 











Un ejemplo de cómo se interpreta este diagrama sería el protocolo de 
terminación de una conexión, en que ya vimos que el extremo TCP que 
pedía el cierre efectuaba un cierre activo. Ello significa que pasaría del 
estado ESTABLISHED al estado FIN_WAIT_1 enviando un segmento 
FIN. 


Desde aquí puede pasar a uno de los tres estados que describen 
cómo se puede realizar un cierre activo dependiendo de cómo se cie- 


rre la conexión: 


e Con un cierre simultáneo (simultaneous close), pasa a CLOSING. 


e Con la recepción de un ACK, pasa a FIN_WAIT_2, donde espera 
recibir un FIN. 


e Con la recepción de un FIN y un ACK, pasa a TIME_WAIT, donde 


espera dos veces el MSL antes de liberar el puerto. 


Ya hemos visto que el extremo TCP que recibe un FIN lleva a cabo 
un cierre pasivo. Por tanto, pasa del estado ESTABLISHED al estado 
CLOSE WAIT enviando los indicadores ACK y FIN correspondientes 


para acabar la conexión. 


La fase de establecimiento también se puede seguir con facilidad por 
medio del diagrama de estados, teniendo en cuenta qué extremo 


efectúa el cierre activo y cuál lleva a cabo el cierre pasivo. 





Actividades 


e Utilizad el comando netstat para ver el estado de 
las conexiones TCP que tengáis en este momento. Si 
no tenéis ninguna aplicación en la red, conectaos a 
algún servidor con la web, haced un ftp o un telnet 


a alguna máquina. 


e Suponed una interacción entre un cliente y un servidor 
en la que el cliente hace una apertura activa y el servi- 
dor una apertura pasiva, a continuación se intercam- 
bian un segmento de datos, con sus correspondientes 
reconocimientos, y finalizan con un cierre activo por 
parte del servidor, pasivo por parte del cliente. Dibujad 
el diagrama de tiempo que muestre el intercambio de 
segmentos, y en paralelo, los estados donde se en- 


cuentran las dos entidades en cada momento. 





| 14.6. Transferencia de la información 


Una vez establecida la conexión, el TCP puede empezar la transfe- 
rencia de segmentos TCP en ambos sentidos. Para tansmitir informa- 
ción de manera fiable, el TCP implementa protocolos de control de 
errores y de flujo. Los pasos que sigue el TCP para transferir la infor- 


mación son los siguientes: 


1) Cuando el TCP envía datos, mantiene un temporizador (timeout) 
hasta que recibe un reconocimiento (ACK) del receptor. Si el tem- 


porizador salta, el TCP retransmite los datos. 
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— Datos interactivos: los 
que transmiten aplicacio- 
nes tales como telnet o 
lo Chelate 


— Bulk data: los que trans- 


miten aplicaciones como 
correo electrónico o ftp. 
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2) Cuando el TCP recibe un segmento de datos, envía un reconoci- 
miento. Este último se puede retornar retrasado (no de inmediato) 


si el TCP lo considera necesario. 


3) Si un segmento recibido es incorrecto (el checksum lo indica), el 
TCP descarta el segmento y no debería enviar la información. De 
hecho, como el TCP utiliza la técnica de piggybacking (aprovecha 
los segmentos de datos que viajan en sentido contrario), lo que 
hace es retornar un segmento con el mismo número de ACK que 
había reconocido la última vez. El transmisor verá un ACK con un 
número repetido e interpretará que no le reconocen la informa- 


ción. Este número se denomina ACK duplicado. 


En caso de que no tuviera datos para enviar en sentido contrario, el 
TCP puede enviar un segmento que no contenga información (con 
un campo de datos de cero bytes). Este segmento tendría el indicador 
ACK activado y reconocería los bytes pertinentes en el campo Núme- 
ro de ACK. El número de secuencia no se habría incrementado, pues- 


to que no envía datos. 


4) Si los segmentos llegan desordenados (por debajo hay el IP, que 
está no orientado a la conexión), el TCP reordena los segmentos 
y pasa los datos (bytes) correctamente ordenados a la aplicación. 


Si recibe segmentos duplicados, el TCP descarta las copias. 


5) Como el TCP posee una memoria limitada, debe efectuar un con- 
trol de flujo. Con esta finalidad, cada extremo avisa de los datos 
que está dispuesto a recibir en cada momento utilizando el cam- 
po Ventana (se trata de un mecanismo de ventana deslizante ba- 


sado en bytes que explicaremos más adelante). 


El tipo de información que es preciso enviar puede dividirse en datos 
interactivos y datos de gran volumen o bulk data. La diferencia entre 
ellos radica en la cantidad de información que se transmite. Los da- 
tos interactivos transmiten pocos bytes de información (alrededor de 
10), mientras que los datos de gran volumen transmiten gran canti- 
dad de datos (ocupan la totalidad del tamaño del segmento TCP). 
Conviene considerar que no es lo mismo cargar la red con paquetes 
pequeños de información que con paquetes grandes. El TCP puede 
aplicar en cada caso técnicas diferentes de manera automática, para 


aprovechar la red al máximo. 


14.6.1. Transmisión de datos interactivos 


En este tipo de comunicación, es normal enviar pocos datos. En una 
aplicación del tipo telnet, por ejemplo, un usuario cliente podría 
ejecutar el comando de Unix 1s y obtener un listado de un directorio 
por parte del servidor. En esta transferencia de información intervie- 
nen pocos bytes desde el origen (cliente) hasta el destino (servidor) y 
se utilizan conjuntamente dos técnicas para obtener un mejor apro- 


vechamiento de la red: 


e Reconocimientos retrasados. 


e Algoritmo de Nagle. 


Reconocimientos retrasados 


En este tipo de transferencia, es normal que el TCP no envíe los re- 
conocimientos ACK inmediatamente después de recibir los datos, sino 
que esté un tiempo esperando a que haya datos para enviar en senti- 
do contrario. De este modo, puede utilizar la técnica piggybacking y 
enviar el reconocimiento encapsulado en los datos que retornan al 


cliente. 


Es posible que el servidor se ahorre enviar un segmento que sólo re- 
conoce, pero que no contiene datos. Es típico que el TCP espere (uti- 
liza un temporizador) unos 200 ms por si hay datos para transmitir 
antes de enviar el ACK. Una vez ha transcurrido este tiempo, el 
TCP reconoce los datos recibidos hasta el momento con un seg- 
mento de datos, si dispone de datos para enviar en sentido con- 
trario (piggybacking), o con un segmento sin datos (el número de 
secuencia no varía). En cualquiera de los dos casos, el indicador ACK 


estará activado y el número ACK reconocerá los datos pertinentes. 


Algoritmo de Nagle 


En numerosas ocasiones un cliente tiene muy pocos datos para enviar 
(por ejemplo, sólo 1 byte). En este caso el TCP enviaría un segmento 
sólo con 1 byte de datos y con 20 bytes de cabecera TCP. El IP aña- 
diría 20 bytes más de cabecera, lo que proporciona un total de 40 


bytes de control y 1 de datos. Si se transmiten muchos segmentos de 
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En la libreria de sockets API, 
el indicador que desinhibe 


el algoritmo de Nagle es el 
TCP_NODELAY. 
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este tipo, la eficiencia es muy baja. Una solución a esta baja eficien- 


cia de transmisión es aplicar el algoritmo de Nagle. 


Utilizando el algoritmo de Nagle, una conexión TCP sólo puede 
tener un segmento de tamaño pequeño (pocos bytes) sin que se 
haya reconocido; es decir, sólo puede haber un único segmento 
de tamaño pequeño viajando por la red (en vuelo). El resto de los 
segmentos de tamaño pequeño no se pueden transmitir hasta que 
el ACK del segmento pequeño que esté viajando por la red haya 


llegado. 


Así, los segmentos que están esperando para ser transmitidos se 
almacenan hasta que se recibe el ACK del segmento en vuelo. 
Cuando este último llega, la conexión TCP puede enviar un seg- 
mento que contenga todos los datos almacenados hasta este mo- 


mento, formando un segmento mayor. 


El algoritmo de Nagle funciona cuando los retardos en la red son 
grandes; es decir, si la conexión cruza una WAN. En caso de que 
la conexión sea local, en una LAN, es difícil que se aplique este 


algoritmo a causa de la alta velocidad de la red. 


En ocasiones, es interesante desinhibir el algoritmo de Nagle, 
puesto que la aplicación no puede esperar. El movimiento del ra- 
tón en X Windows System provoca segmentos pequeños. Estos mo- 
vimientos del ratón deben entregarse sin retardos para que el 
usuario interactivo no lo note. Las librerías de sockets deben per- 


mitir, activando indicadores, desinhibir el algoritmo de Nagle. 


14.6.2. Transmisión de datos de gran volumen. Control 
de flujo por ventana deslizante 


En las comunicaciones en que se envía una ingente cantidad de da- 
tos de gran volumen (correo electrónico, transferencias FTP, etc.), 
como las memorias intermedias de recepción se pueden llenar, es 
necesario un protocolo de ventana deslizante (sliding window) para 
controlar el flujo de datos, con la diferencia, respecto de los protoco- 
los del nivel de enlace, de que en el TCP la ventana de transmisión 


es variable. 


La idea es que cada extremo TCP regula la cantidad de datos que 
el otro extremo puede transmitir. Con esta finalidad, cada extremo TCP 
notifica al extremo opuesto, cada vez que envia un segmento, la ven- 
tana que puede aceptar en este momento. El TCP opuesto actualiza 


su ventana de transmisión de acuerdo con este valor. 


Mientras que el TCP transmisor marca los bytes que ha transmiti- 
do con un número de secuencia, el TCP receptor retoma los bytes 
que recibe y los reconoce con un ACK. Los reconocimientos ACK 
especifican siempre el número de secuencia del próximo octeto 


que el receptor espera recibir. 





El TCP sólo activa un temporizador de retransmisiones que reprograma 
cuando recibe un reconocimiento o cuando salta el temporizador. Más 
adelante veremos cómo el TCP programa el temporizador de retrans- 
misiones. La cabecera del segmento TCP especifica tres parámetros 


esenciales en el funcionamiento del protocolo de ventana deslizante: 


+ El número de secuencia, que indica a su conexión opuesta el pri- 


mer byte de datos que contiene el segmento transmitido. 


+ El número de reconocimiento (número ACK), que indica a su 
conexión opuesta el próximo byte que espera recibir y, por tanto, 


el último byte recibido correctamente. 


e La ventana, que indica a su conexión opuesta el tamaño de la 
memoria intermedia de recepción y, por tanto, el tamaño de la 


ventana que el transmisor debe utilizar. 





Actividad 


Asumimos que un extremo cliente TCP ha elegido el 
28.325 como número de secuencia inicial (ISN), mien- 
tras que el extremo servidor TCP ha elegido como ISN 
el 12.555. ¿Qué indica un segmento cliente TCP con 
número de secuencia 29.201, número ACK 12.655 y 
ventana 1.024? 
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Recordad que el TCP es bi- 
direccional y que un seg- 
mento TCP reconoce, por 


medio de piggybacking, los 
datos que recibe con un 
ACK que debe estar nume- 
rado. 
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Solución 


El número de secuencia indica que el cliente ya ha 
transmitido desde el byte 28.325 hasta el byte 29.200 
(875 bytes en total) y que en este segmento transmitirá 
a partir del byte 29.201. El número ACK indicará al 
servidor que el cliente ha recibido correctamente hasta 
el byte 12.654 y que espera recibir a partir del 12.655. 
La ventana indica al servidor que el cliente sólo puede 
aceptar 1.024 bytes antes de confirmarlos. Por consi- 
guiente, el servidor TCP actualizará su ventana de 


transmisión a 1.024. 





Con el objetivo de estudiar el mecanismo de ventana deslizante, 
analizaremos un caso sencillo. Asumiremos que ya se ha establecido 


la conexión y se ha asignado la ISN para ambos extremos. 


En la figura siguiente, podemos ver como funcionaría el protocolo de 
ventana deslizante para el TCP transmisor. El TCP receptor le ha in- 
dicado que esté dispuesto a recibir 7 bytes. Por tanto, la ventana de 


transmisión de TCP transmisor es de 7 bytes: 





| Figura 71. | 





Ventana=7 bytes 


que Jable lp] 


sonibles se mueva 


Lo ventana 
do 





Podemos interpretar la ventana deslizante de la manera siguiente: 


1) El TCP ha enviado bytes hasta el número de secuencia 1.003. De 
estos bytes, el TCP receptor le ha reconocido hasta el 999; fal- 


tan por reconocerle los bytes 1.000 a 1.003. 


2) Como la ventana de transmisión es de 7 bytes y ya ha transmitido 
4, el TCP todavía puede transmitir 3 bytes antes de agotarla (bytes 
1.004 a 1.006). 


3) El TCP sólo podrá transmitir del byte 1.007 en adelante en los ca- 


sos siguientes: 


e Si el TCP receptor le reconoce los bytes a partir del 1.000, de 
manera que el límite izquierdo de la ventana se moverá hacia 


la derecha. 


e Si el TCP receptor le advierte de una ventana superior a 7, de 
manera que el límite derecho de la ventana se moverá hacia 


la derecha. 


+ Una combinación de las dos soluciones anteriores. 


Como podéis observar, el TCP receptor puede advertir una nueva 
ventana de transmisión. Cada vez que reconozca datos, avisará de 
la nueva ventana que está dispuesta a recibir. El TCP transmisor ac- 


tualizará esta última. 





Algunos puntos que podemos resumir de la figura de la ventana des- 


lizante son los siguientes: 


e Si el límite izquierdo alcanza el límite derecho, se dice que la ventana 
vale cero (zero window). Ello hace que el transmisor detenga el envío 
de datos. 
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e Se recomienda que el TCP transmisor no comprima la ventana de 


transmisión. 


e Es preciso que distingamos el hecho de que la ventana se comprima 
(el límite derecho se mueve hacia la izquierda) del hecho de que la 
ventana disminuya de tamaño (se advierte una ventana más peque- 


ña, pero el límite derecho no se mueve hacia la izquierda). 





Nota 





Supongamos una ventana de 7 bytes como en la figura- 
de la ventana deslizante. El receptor reconoce los bytes 
1.000 a 1.003 y advierte una ventana de 5 bytes. Como 
podéis deducir, el límite izquierdo vale ahora 1.004; el 
límite derecho, 1.008 (se ha movido hacia la derecha), 
y la nueva ventana, 5. En este caso, la ventana de recep- 


ción debe reducirse, pero no se ha comprimido. 


En cambio, si el receptor sólo reconoce 1 byte (el 
byte 1.000) y advierte una ventana de 1 byte, el trans- 
misor se encontrará con un problema. Una ventana 
de 1 byte significa que sólo podía haber transmitido 1 
(el 1.001), pero ya había transmitido 3, incluyendo el 
reconocido (del 1.000 al 1.003). Por tanto, el receptor 
debe asegurarse de advertir al menos tantos bytes 
como el transmisor le puede haber enviado con la 
ventana anterior. Si sólo reconoce 1 byte, la ventana 
advertida debe ser de 6 bytes; si reconoce los 4 bytes, 
esta última debe ser, al menos, de 3 bytes, puesto que 


el transmisor ya los podría haber transmitido. 








Ejemplo 


Utilizaremos el programa tcpdump para observar cómo funciona el 
protocolo de ventana deslizante. Asumimos que hemos efectuado un 
rlogin de argos a helios (argos % rlogin helios) y ya estamos co- 
nectados a helios. Una vez nos encontramos en helios, ejecutamos el 
comando 1s. Este último retorna por salida estándar el listado de di- 
rectorios del directorio del usuario (home directory) en helios que 


ocupan 811 caracteres (representa el envío de 811 bytes) 


o 


helios % ls 


Las lineas que obtenemos con el programa tcpdump (numeradas 


del 1 al 13) son las siguientes: 


)15:56:59.506091 argos.1023 > helios.login: P 37:38 (1)ack 596 win 31744 
)15:56:59.516091 helios.login > argos.1023: P 596:597 (1) ack 38 win 8760 
)15:56:.59.526091 argos.1023 > helios.login: .ack 597 win 31744 
)15:56:59.846091 argos.1023 > helios.login: 38:39 (l)ack 597 win 31744 
)15:56:59.856091 helios.login > argos.1023: : P 597:600 (3) ack 39 win 8760 
)15:56:59.866091 argos.1023 > helios.login: .ack 600 win 31744 
)15:57:00.116091 argos.1023 > helios.login: P 39:40 (1)ack 600 win 31744 
)15:57:00.126091 helios.login > argos.1023: P 600:603 (3) ack 40 win 8760 
9)15:57:00.136091 argos.1023 > helios.login: .ack 603 win 31744 
0 
el 
2 
3 


FU 


10)15:57:00.146091 helios.login > argos.1023: P 603:658 (55) ack 40 win 8760 
)15:57:00.156091 argos.1023 > helios.login: .ack 658 win 31744 
)15:57:00.166091 helios.login > argos.1023: P 658:1414 (756) ack 40 win 8760 
)15:57:00.176091 argos.1023 > helios.login: .ack 1414 win 31744 


La interpretación de estas líneas es la siguiente: argos ya ha enviado 
36 bytes, mientras que helios ya ha enviado 595 (información que 
ambos han intercambiado desde el principio de la conexión, como 
pueden ser logins, usernames, etc.). Deducimos esta información de 


la primera línea del ejemplo. 


1) argos envía el carácter ‘l’. El indicador P señala PUSH. El número 
de secuencia avanza de 37 a 38. — 
Recordad que PUSH indica 
al receptor que pase los da- 

. z 4 r T 
2) helios retorna un eco del carácter ‘l’. Su número de secuencia avanza fos mehren a E 


de 596 a 597 y reconoce el byte recibido (ACK = 37 + 1 = 38). aplicación; es decir, que no 


los deje durante un tiempo 


en la memoria intermedia 
3) argos reconoce el eco: ACK = 597 + 1 = 598. STT 





4) argos envía el carácter 's'. El número de secuencia avanza de 


38 a 39. El ACK no reconoce nada porque vale igual que an- 
tes: ACK = 597. 


5) helios hace un eco que ocupa 3 bytes (BS + 1 + s). El número de 
secuencia avanza tres posiciones (de 597 a 600) y reconoce el ca- 
rdcter ‘s’ , puesto que ACK = 38 + 1 = 39. 


6) argos reconoce el eco con un ACK = 600. 


7) argos envía el retorno de carro (CR). El número de secuencia 


avanza una posición. 


8) helios hace un eco del CR y, asimismo, retorna otro CR seguido 
de un LF. Ello significa el envío de 3 bytes. Reconoce el CR, 
puesto que ACK = 40. 
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9) argos reconoce estos tres caracteres. 


10) helios responde a ‘Is’ enviando 55 de los 811 bytes que debe en- 
viar. El número de secuencia avanza de 603 a 658. El ACK se men- 
tiene a 40. 


11) argos reconoce estos 55 bytes enviando un ACK de 659. 
12) helios transmite el resto de los 811 bytes, es decir, 756 bytes. 
13) argos reconoce estos bytes avanzando el ACK a 1.414. 


Como podemos observar en este ejemplo, el TCP divide la informa- 
ción que hay que enviar en dos segmentos: un segmento de 55 
bytes y otro de 756 bytes. Conviene remarcar que rlogin envía los 
comandos carácter a carácter y que, además, la aplicación remota 
hace un eco de estos caracteres. Por ello, en las primeras líneas se 
envía primero la ‘I’, después la ‘s’, a continuación el retorno de ca- 
rro, etc. Lo que nos interesa de este ejemplo es ver cómo avanzan 
las ventanas al emitir y al reconocer bytes. Por tanto, no justificare- 
mos por qué rlogin retorna ecos, ni por qué añade un carácter LF 


al retorno de carro. 


14.6.3. Temporizadores y retransmisiones 


El TCP activa hasta cuatro temporizadores de diferente tipo para 
conseguir una entrega fiable de la información. En este subapar- 
tado nos centraremos únicamente en el temporizador de retrans- 


misiones o RTO (del inglés, retransmission time out). 


Conviene recordar que tanto los segmentos como los reconoci- 
mientos se pueden perder durante la transmisión, de manera que 


es preciso utilizar un temporizador de retransmisiones. 


Como ya hemos mencionado, el temporizador se programa cada 
vez que se recibe un reconocimiento, o bien cuando salta porque 
el reconocimiento no ha llegado a tiempo (o, simplemente, no ha 


llegado). 





Lo más lógico sería activar el temporizador de retransmisión en el 
tiempo de ida y vuelta (RTO = RTT). Sin embargo, es evidente que 
los retardos que experimentan los segmentos son variables: si se 
activa el RTO en el RTT que ha experimentado el segmento ante- 
rior, no se puede asegurar que este segmento no tenga un retardo 
superior y que el temporizador no salte antes de tiempo. Por otra 
parte, si el temporizador se programa a un valor mucho mayor 
que RR, cada vez que haya una pérdida estaremos esperando en 


balde un buen rato, con la consiguiente pérdida de eficiencia. 


Existen diferentes alternativas para programar el temporizador, 
todas orientadas a encontrar un valor adecuado de RTT; es decir, 


que no sea demasiado corto ni demasiado largo. 
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Lectura complementaria 


Podéis encontrar los dife- 
rentes algoritmos propues- 
tos para el cdculo de RTT en 
la obra siguiente: 


W.R. Stevens (1994) 

"The protocols". TCP/IP 
Illustrated (vol. 1) Willmington: 
Addison-Wesley. 





| IV. Aplicaciones Internet 


| 15. El modelo cliente/servidor 


Las redes de computadores han hecho aparecer un concepto nuevo 
en el mundo de la programación: la programación distribuida. Con 
esta última se pretende aprovechar la potencia y los recursos de los 
ordenadores interconectados para llevar a cabo una tarea de forma 


cooperativa. 


Una aplicación distribuida está formada por varios programas que 
se ejecutan en ordenadores diferentes y que se comunican por medio 


de la red que une a los ordenadores. 





La cooperación de los diferentes trozos de código que forman la apli- 
cación debe seguir un protocolo. Este último se puede elaborar a 
medida para cada aplicación que se desarrolle, o se puede definir 
un estándar que todo el mundo pueda seguir y así ahorrarse, de este 
modo, los diseños particulares. Asimismo, la existencia de un proto- 
colo estándar garantiza la posibilidad de interactuar con productos 


de diferentes fabricantes. 


Existen varios estándares de aplicaciones distribuidas; sin embargo, 
sin lugar a dudas, el que ha tenido más éxito es el que sigue el mo- 


delo cliente/servidor. 
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Por norma general (al menos es lo que dice el modelo), los usuarios 


acceden a la aplicación por medio del cliente. 





Figura 72. 














El usuario de las aplicaciones puede ser una persona, pero también 
otra aplicación. En el primer caso, el cliente debe disponer de una 
interfaz de usuario que permita el diálogo, canalizando las peticio- 
nes y mostrándole los resultados. En el segundo, el acceso se suele 


implementar con llamadas a funciones. 


El modelo se puede complicar si se añaden más entidades a la apli- 


cación distribuida. Veamos dos ejemplos: 


e Múltiples clientes: 





Figura 73. 











n 


em 








El servidor debe estar preparado para recibir 
múltiples conexiones, que pueden ser simultáneas. 
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¢ Multiples servidores: 





Figura 74. 








eo. cr 








Varios servidores ofrecen servicios complementarios. Si el servi- 
dor no puede satisfacer la petición del cliente, pero está en con- 
tacto con otro servidor que sí que puede hacerlo, entonces se lo 
solicita. 

Los servidores pueden dialogar entre sí con protocolos propios o 
siguiendo el modelo cliente/servidor. 











Desde el punto de vista del cliente, esta multiplicidad de servidores 
es completamente transparente: realiza una petición a un servidor y 


espera una respuesta del mismo. 


Cuando diferentes servidores cooperan para ofrecer un servicio, ha- 


blamos de sistema servidor. 


La gran mayoría de las aplicaciones que se utilizan en Internet si- 
guen este modelo cliente/servidor. De aquí los nombres que se em- 
plean con asiduidad: servidor web, cliente de correo, servicio de 


nombres, etc. 
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El servicio DNS y el servicio 
News (o Usenet o NNTP), 


presentes en Internet desde 


sus inicios son claramente 
peer-to-peer. 
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| 15.1. El modelo peer-to-peer 


El modelo cliente/servidor implica una cierta asimetria. Tendemos a 
ver los servidores como sistemas potentes que ofrecen sus servicios a 
máquinas mucho más sencillas, los clientes. El gran desarrollo de In- 
ternet en su vertiente comercial ha contribuido a esta visión. Los 
usuarios de Internet, desde sus PC, tienen un claro comportamiento 
de cliente, accediendo a páginas web alojadas en servidores remo- 


tos, o enviando correos electrónicos a otros usuarios. 


A medida que el uso de Internet ha madurado, los usuarios de la Red 
han sentido la necesidad de desempeñar un papel más activo, y con- 
vertir sus máquinas en servidores que otros puedan aprovechar, o 
desarrollar nuevos modelos de aplicación donde los roles no están 
tan claramente diferenciados. Uno de estos modelos es el que se co- 
noce como peer-to-peer (‘de igual a igual’), y las aplicaciones más 
tipicas que siguen este modelo de comportamiento son los sistemas 


de compartición de archivos o la mensajería instantánea. 





Nota 





Diferentes características de la Red que se han ido aña- 
diendo por cuestiones de seguridad o de eficiencia de la 
Red están perjudicando mucho el desarrollo de entornos 
peer-to-peer. Podemos citar como las más paradigmáti- 
cas los cortafuegos, las direcciones IP dinámicas, el NAT 
(Network Address Translation) y el ancho de banda asi- 
métrico que ofrecen en muchos casos los proveedores de 
Internet en los dos sentidos de transmisión. La mayoría 
de aplicaciones intenta sobreponerse a estos obstáculos 
con estrategias más o menos afortunadas. De todas for- 
mas, está claro que en un futuro tienen que cambiar co- 
sas en el nivel de red para no limitar las enormes 


posibilidades que tenemos en el nivel de aplicación. 








De hecho, Internet en su origen era peer-to-peer. Los primeros orde- 
nadores conecatodos a la Red eran parecidos, y una aplicación 
como ftp permitía la transferencia de archivos entre cualesquiera 
de estas máquinas. Dicho de otra forma, que el protocolo que usa la 
aplicación siga el modelo cliente/servidor no es incompatible con 
que la red esté formada por ordenadores de potencia parecida y en- 


tre ellos se vean como una red peer-to-peer. 


Porque en el fondo, si analizamos como funcionan las aplicaciones 
típicas de entornos peer-to-peer, como el extinto Napster, o Gnutella 
o |ICQ o Jabber, veríamos que siguen protocolos típicos cliente/ser- 
vidor, tipo "yo te pido, tu me das". Lo que pasa es que en este tipo de 
entornos cualquiera puede hacer a la vez de cliente y de servidor. Por 


tanto, es erróneo considerar ambos modelos excluyentes. 





Por otra parte, existen aplicaciones consideradas peer-to-peer por- 
que permiten la comunicación directa entre iguales, pero que nece- 
sitan de un servidor externo (o varios) donde se centraliza el control 
de la red (Napster era un claro ejemplo de este modelo). Hay autores 
que son reacios a considerar estos entornos realmente peer-to-peer, 
y prefieren guardar el término para aquellas redes donde sólo inter- 
vienen las máquinas propiedad de los propios usuarios. No es obje- 


tivo de este material didáctico entrar en esta discusión. 
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| 16. Servicio de nombres Internet 


La red Internet permite el acceso a una ingente cantidad de orde- 
nadores y, en general, de recursos, la mayoría de los cuales se 
pueden referenciar mediante un nombre. Por motivos de eficien- 
cia y simplicidad (poder saber con facilidad qué recurso corres- 
ponde a cada nombre, poder asignar otros nuevos sin peligro de 
duplicidades o ambigüedades, etc.), todos los nombres de la red 
están organizados de una manera jerárquica, formando un siste- 


ma de dominios. 


Para obtener información referida a cualquier nombre, se utiliza un 
servicio que, funcionalmente, es como una base de datos: se le ha- 
cen consultas, que pueden incluir una serie de criterios de selección, 
y responde con la información solicitada. En un inicio, cuando el nú- 
mero de ordenadores conectados a la red era relativamente peque- 
ño, esta base de datos era gestionada por una única autoridad 


central, el Network Information Center (NIC). 


A medida que se expandía la Red, este modelo de gestión se iba 
haciendo cada vez más inviable, tanto por el enorme tráfico que 
generaban las consultas, como por la dificultad de mantener la in- 
formación actualizada. Fue entonces cuando nació el servicio de 


nombres de dominio (DNS), que sigue el modelo de una base de datos 


Si queréis más información sobre el DNS, podéis con- 


distribuida descentralizada. 








sultar las obras siguientes: 


P.V. Mockapetris (1987,1 de noviembre). RFC 1034- 


Domain names - concepts and facilities. 


P.V. Mockapetris (1987, 1 de noviembre). RFC 1035- 


Domain names - implementation and specification. 
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A la hora de comparar 
nombres, las letras mayús- 
culas y minúsculas se consi- 


equivalentes. No 
para 
las consultas, los servidores 
DNS deben enviar los nom- 
bres tal como estan almace- 
nados en la base de datos, 
respetando las mayúsculas 
y minúsculas, en previsión 
del caso de que en alguna 
versión futura del servicio se 
consideren diferentes. 


deran 


obstante, responder 





172 


La especificación del DNS está contenida en los documentos RFC 
1034, que define los conceptos y la organización del sistema de 
dominios, y RFC 1035, que define el protocolo de acceso al ser- 


vicio. 


| 16.1. El sistema de nombres de dominio 


El sistema de nombres de dominio, en que se basa el DNS, propor- 
ciona un espacio de nombres para referenciar recursos, que por nor- 
ma general son ordenadores conectados a la red, pero que también 


pueden ser, por ejemplo, buzones de correo electrónico. 





Cada etiqueta constituye una cadena de caracteres de longitud com- 
prendida entre O y 63 caracteres. La etiqueta con longitud O está re- 
servada para el nodo raíz: ningún otro nodo puede tener una 


etiqueta vacía. 


El protocolo de acceso al DNS define el formato para representar los 
nombres de dominio cuando deben enviarse en las consultas y las 
respuestas, como veremos más adelante. Este formato no impone 
restricciones en los caracteres que puede haber en una etiqueta; sin 
embargo, establece una “sintaxis preferida” para facilitar las imple- 
mentaciones de otros servicios. De acuerdo con esta última, los Uni- 
cos caracteres válidos en una etiqueta son las letras, mayúsculas o 
minúsculas, los dígitos decimales y el simbolo “-”, con la excepción 
de que el primer carácter sólo puede ser una letra, y el último no pue- 


de ser “-”. 


Aparte de la representación definida en el protocolo, cuando se de- 
sea utilizar una notación textual para expresar un nombre de dominio, 
se sigue la convención de concatenar las etiquetas que lo forman, sepa- 
rándolas con el carácter “.”. En el orden utilizado, las etiquetas van 
desde el más bajo nivel jerárquico más bajo hasta el más alto. Por 
tanto, la última etiqueta es la del nodo raíz que, como acabamos de 

u n 


observar, está vacía, de manera que los nombres acaban en “.”, 


como en el ejemplo siguiente: 


campus.uoc.edu. 





Notad la presencia del punto final. 








Este ejemplo es el que se denomina un nombre de dominio abso- 
luto, pero también pueden utilizarse nombres relativos, referidos 
a un nodo origen implícito. Así, dentro del dominio uoc.edu. 
podemos utilizar el nombre tibet para referirnos al nombre de 
dominio tibet.uoc.edu.. En numerosas ocasiones, el nodo 
origen de los nombres relativos es la raíz, de manera que el ejem- 


plo anterior también puede escribirse del modo siguiente: 


Campus .uoc.es 


En un inicio, los TLD (top level domain, “dominios de nivel supe- 
rior”); es decir, los subordinados directamente a la raíz, se utiliza- 
ban para agrupar los diferentes tipos de organizaciones a que 
pertenecían recursos como, por ejemplo, los que presentamos en 


la tabla siguiente: 





Tabla 6. 











Tipos de organización Nombre del dominio 
Empresas y organizaciones comerciales 


Universidades y centros educativos 





Organismos gubernamentales 





Organizaciones militares 





Otros tipos de organizaciones 
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En el Reino Unido antes era 
usual utilizar el orden inverso 


en la representación textual 


de los nombres de dominio, 
por ejemplo: 
uk.ac.ic.doc.sre en lu- 
gar de src.doc.ic.ac.uk; 
sin embargo, hoy dia esta 
costumbre se encuentra en 
desuso. 





En estos momentos, el orga- 
nismo encargado de gestio- 
dominios es la 


nar los 
ICANN. Podéis consultar su 
web: hitp://www.icann.org. 






Consultad la definición de 
sistema servidor en la uni- 


dad 15. 
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Desde entonces hasta la actualidad, se han ido añadiendo al nivel 


superior del sistema de nombres los elementos siguientes: 


a) Por un lado, nuevas clases de organizaciones, como net (centros 
relacionados con la gestión de la red), int (organizaciones inter- 
nacionales) o, más recientemente, biz, info, name, pro, aero, 


coop y museum. 


b) Por otro lado, cada país tiene asignado un nombre de dominio 
que coincide con el código correspondiente de dos letras especi- 
ficado en el estándar ISO 3166, por ejemplo: es (España), fr 
(Francia), de (Alemania), etc. Lo que significa que, en realidad, 
las diferentes ramas del árbol se pueden encabalgar y, de hecho, 
hay nombres pertenecientes a diferentes dominios de alto nivel 


que corresponden a una misma organización. 


Asimismo, es posible que un determinado recurso (ordenador, buzón 
de correo, etc.) tenga asignados varios nombres, que pueden estar 
en la misma rama del árbol o en ramas completamente indepen- 
dientes. En este caso, se considera que uno de los nombres es el de- 


nominado nombre canónico y los otros se denominan alias. 


| 16.2. Modelo del DNS 


Los agentes que intervienen en el DNS son los siguientes: 


a) Los servidores, que reciben las consultas y envían las respuestas 
correspondientes. Además del acceso directo a una base de datos 
local, en la que se encuentra una porte de la base de datos total 
del sistema de nombres, el servidor tiene acceso indirecto al resto 
de la base de datos por medio de otros servidores. El conjunto de 


servidores DNS constituye, pues, un sistema servidor. 


b) Los resolvedores, que actúan como clientes del servicio. Por nor- 
ma general, un resolvedor es un programa o una librería que re- 
cibe peticiones de las aplicaciones de usuario, las traduce a 
consultas DNS y extrae de las respuestas la información solicita- 
da. El resolvedor debe tener acceso directo al menos a un servidor 
DNS. 





Nota 





Utilización del resolvedor 


Una aplicación que sirva para copiar ficheros almace- 
nados en otros ordenadores puede aceptar que el 
usuario indique a qué ordenador desea acceder por 
medio de su nombre. Por consiguiente, para poderse 
comunicar con él, la aplicación deberá realizar una 
llamada al resolvedor para obtener su dirección a 
partir del nombre. Como la aplicación y el resolvedor, 
por lo general, se encontrarán ubicados en el mismo 
sistema, no es necesario establecer ningún protocolo 


de comunicación entre ellos. 








Para hacer manejable la gestión y administración del sistema de 
nombres de dominio, sus nodos están agrupados en zonas. Cada 
zona está formada por un nodo llamado superior y todos los que se 
encuentren en los niveles jerárquicamente inferiores hasta llegar a 
los nodos terminales (las hojas del árbol) o a nodos de otras zonas 


que sean superiores. 


La figura siguiente muestra un ejemplo de división de un árbol en 


cuatro zonas: 





Figura 75. 














El objetivo de agrupar los nodos en zonas consiste en asignar a una au- 


toridad la responsabilidad de gestionar todos los nodos de cada zona. 
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Como cada zona se suele 
denominar con el nombre 


de dominio de su nodo su- 
perior, podemos decir que 
las zonas de la figura son A, 
B.A, C.Ae1.C.A. 





Una zona puede correspon- 
der a un pais y sus subzonas 
pueden corresponder a or- 


ganizaciones de este pais. 
Cada organización, a su 
vez, puede crear subzonas 
para diferentes departa- 


mentos, etc. 
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El administrador designado para esta autoridad puede añadir o borrar 
nodos dentro de su zona, modificar la información de sus nodos o crear 


nuevas subzonas y delegar su gestión en otras autoridades. 


La información referida a una zona debe estar almacenada en la base 
de datos local de un servidor, del que se dice que es un servidor con au- 
toridad sobre esta zona. Este último puede contestar directamente las 
consultas que reciba sobre los nodos de su zona, sin necesidad de ac- 
ceder a otros servidores. Es decir, en este caso, el servidor enviará res- 


puestas con autoridad. 


Si una consulta se refiere a otra zona, existen dos maneras posibles de 


generar la respuesta: 


e Enel modo no recursivo, la respuesta Únicamente incluye una refe- 
rencia a algún servidor que puede proporcionar más información. El 
cliente debe preocuparse de continuar realizando consultas hasta 


encontrar la respuesta definitiva. 


e Siel cliente solicita el modo recursivo, es el servidor quien se ocupa 
de buscar la información donde sea preciso, y sólo puede retornar la 


respuesta final o un error, pero no referencias a otros servidores. 


La especificación DNS establece que todos los servidores deben sopor- 
tar el modo no recursivo, y que el modo recursivo es opcional, aunque 
en la práctica, la mayoría de las consultas de los clientes son en modo 


recursivo. 


Cuando un servidor debe responder a una consulta en modo re- 
cursivo, pide la información a otros servidores y envía la respuesta 
recibida a quien ha realizado la consulta. Es habitual que el ser- 
vidor añada la información obtenida a su base de datos, en lo que 
se denomina caché. De este modo, si recibe otra consulta (del 
mismo cliente o de otro) en la que se solicita la misma informa- 
ción, no será necesario que se la pida de nuevo a otros servidores, 
sino que puede aprovechar la ya existente en la caché. Sin embar- 
go, es posible que los datos se hayan modificado en el servidor 
de origen desde que se solicitaron por primera vez. En este caso, 


pues, el servidor debe avisar al cliente de que le envía una res- 


puesta sin autoridad. Por otro lado, los resolvedores también sue- 
len guardar en una caché propia las respuestas que reciben de los 


servidores. 


Para ofrecer una alta fiabilidad en el servicio, la especificación DNS 
requiere que para cada zona haya como mínimo dos servidores con 
autoridad que, por norma general, responden a las siguientes fun- 


ciones: 


a) Uno actúa como servidor primario y guarda los ficheros origina- 
les de la base de datos correspondiente a la zona; es decir, aque- 
llos que el administrador debe actualizar directamente cada vez 


que haya una modificación en sus nodos. 


b) Los otros actúan como servidores secundarios y actualizan auto- 
máticamente sus bases de datos a partir de la del primario; por 
ejemplo, por medio de consultas periódicas para saber si se ha 
producido algún cambio. De este modo, si un servidor primario 
está temporalmente inaccesible (por una caída de la red, del mis- 
mo servidor, etc.), los clientes pueden enviar sus consultas a uno 


de los servidores secundarios. 


La figura siguiente muestra una posible configuración del servicio 


DNS en un ordenador: 





Figura 76. 














En la práctica, se pueden encontrar muchas variantes de este esque- 
ma; por ejemplo, que el servidor DNS se encuentre en el mismo or- 
denador que el resolvedor y que ambos compartan la caché, que el 


resolvedor tenga acceso a diferentes servidores DNS, etc. 
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En el argot DNS, refrescar 


los datos significa actuali- 
zarlos realizando consultas 
periódicas. 
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| 16.3. Base de datos DNS: los registros de recurso 


Como hemos visto en los subapartados anteriores, un nombre del 


sistema de dominios identifica un nodo, y para cada nodo puede ha- 


ber cierta información almacenada en los servidores correspondien- 


tes. El objetivo del servicio DNS consiste en permitir la obtención de 


dicha información a partir del nombre de dominio. 





Cada registro de recurso consta de los campos siguientes, que se ex- 


plican a continuación: 


a) 


b) 


Nombre. 

Tipo. 

Clase. 

Tiempo de vida. 


Datos del recurso. 


Nombre. Contiene el nombre de dominio del nodo al que está 


asociado el registro. 


Tipo. Indica qué tipo de información contiene el registro. Los va- 
lores que podemos encontrar en este campo y los tipos de infor- 


mación que representan son los siguientes: 


A: dirección de un ordenador. 

CNAME: nombre canónico de un alias. 

HINFO: información sobre el tipo de ordenador. 

MX (Mail eXchanger): nombre de un servidor de correo electrónico 
para un dominio. 

NS: nombre de un servidor DNS con autoridad para una zona. 
PTR: nombre de un dominio que contiene información relaciona- 
da con un nodo. 

SOA (Start Of Authority): información sobre el nodo superior de 


una zona. 


Otros valores posibles del campo Tipo son los siguientes: 


d) 


e) 


MB: nombre de un buzón de correo. 
MG: miembro de un grupo de correo. 
MR: nombre nuevo de un buzón de correo. 


MINFO: información sobre un buzón o una lista de distribución de 


correo. 


WKS (Well Known Services): lista de servicios que proporciona un 


ordenador. 
TXT: texto descriptivo. 


NULL: registro vacio. 


Clase. Indica la familia de protocolos utilizada en el espacio de 
nombres. Por norma general, será la familia de protocolos Inter- 


net, pero puede haber otros. 


Tiempo de vida (TTL). Indica el tiempo máximo que un servidor 


o un resolvedor puede guardar el registro en su caché. 


Datos del recurso (RDATA). El valor de este campo depende del 


tipo de registro: 


Si el registro es de tipo A, en la clase Internet, el valor es un número 


de 32 bits que corresponde a una dirección IP. 


Si el registro es de tipo CNAME, el valor es un nombre de dominio 
que corresponde al nombre canónico del alias asociado con el re- 
gistro. Si un nodo del árbol de nombres es un alias, la Única in- 


formación que puede tener asociada es un registro CNAME. 


Si el registro es de tipo HINFO, el valor es una cadena de caracteres. 


Si el registro es de tipo MX, el valor tiene dos subcampos, el pri- 
mero es un número que representa una preferencia (cuanto me- 
nor es el número, más preferencia) y el segundo es el nombre de 
un ordenador que está dispuesto a aceptar mensajes destinados 


al dominio correspondiente al registro. 


El sistema de nombres de 
dominio proporciona un 
conjunto de espacios de 
nombres, uno para cada 
clase, todos sobre un mismo 
árbol. Los datos correspon- 
dientes a un nodo en una 
clase pueden ser diferentes 
de las del mismo nodo en 
otra clase (un nodo puede 
no tener ningún registro de 
recurso de alguna clase), 
puesto que las bases de da- 
tos (como las divisiones en 


zonas) son separadas e in- 


dependientes. 








Nota 





El estándar RFC 974 especifica cómo deben utilizarse 
los registros MX para direccionar un mensaje de correo 
electrónico dada la dirección del destinatario (por 
ejemplo, usuariftuoc.edu). De esta dirección se se- 
para a parte correspondiente al dominio de correo 
(uoc.edu), se consulta el sistema DNS para saber 
qué servidores aceptan correo para este dominio y se 
elige uno teniendo en cuenta su preferencia. Si la co- 
municación con este servidor no tiene éxito, se intenta 


con los otros por orden de preferencia. 


Si no hay ningún registro MX asociado al dominio, se 
entiende que sólo dispone de un servidor de correo: el 


ordenador que tenga por nombre el del dominio. 








e Si el registro es de tipo NS, el valor es un nombre de ordenador. 


e Siel registro es de tipo PTR, el valor es un nombre de dominio. 





e Si el registro es de tipo SOA, el valor del campo RDATA en un registro 





de este tipo está formado por los siete subcampos siguientes: 





Cada nodo que sea el supe- 
rior de una zona debe tener 
asociado un registro SOA. 





— MNAME: nombre del servidor primario de la zona. 





— RNAME: nombre de dominio correspondiente al buzón del res- 


ponsable de la zona. 


El nombre del buzón puede — SERIAL: número que debe aumentarse cada vez que haya 
expresarse como un nom- 
bre de dominio siguiendo la 
sintaxis general de separar 
los nombres de los nodos 
con “.” (en este caso, la par- secundarios refresquen sus datos. 


una modificación en los datos de la zona. 


— REFRESH: tiempo que debe transcurrir para que los servidores 


te correspondiente al usua- 
rio sería el nodo inferior). — RETRY: tiempo que es preciso esperar para volver a intentar 


IO un refresco si no se ha conseguido contactar con el servidor 
usuari@uoc.edu le co- 


rresponde el nombre de do- 
minio uSuari.uoc.edu. 


primario. 





— EXPIRE: tiempo máximo a partir del cual los datos de un ser- 
vidor secundario se considerarán sin autoridad si no se han re- 


frescado. 








— MINIMUM: valor mínimo del campo TTL en los registros de la 








zona. 
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Nota 





Refresco de una zona en un servidor secundario 


El proceso de refresco de una zona en un servidor se- 


cundario consiste en pedir al primario su registro SOA 





y comprobar si ha variado el campo SERIAL. Si ha 
variado, es preciso llevar a cabo una transferencia de 
los datos de la zona (por ejemplo, con una petición 
AXFR del protocolo DNS, por medio del protocolo 


FTP, etc.) y, si no, no es necesario hacer nada. 








El protocolo de acceso al DNS, como veremos en el subapartado si- 
guiente, define el formato de representación de los registros de re- 
curso en las respuestas de los servidores. Sin embargo, también es 
habitual utilizar una representación textual; por ejemplo, en los fiche- 
ros de la base de datos que el administrador de una zona puede edi- 
tar y actualizar. La sintaxis típica de esta representación textual es la 


siguiente: 


[nombre] ( [clase] [TTL] | [TTL] [clase] ) tipo RDATA 


Cada registro se escribe en una línea; sin embargo, si es dema- 
siado largo, se pueden utilizar paréntesis, dentro de los cuales se 
ignoran los saltos de línea. El símbolo “;” sirve para introducir 
comentarios en el mismo. El campo Nombre es opcional (por de- 
fecto se toma el del registro anterior), como también lo son cla- 
se (el valor del campo clase, por norma general, es IN, que 
correspoonde a la clase Internet) y TTL, que se pueden escribir 
en cualquier orden. Los campos que representan dominios pue- 
den ser absolutos (acabados en “.”) o relativos (respecto a un 
origen preestablecido), y los que representan tiempo se expresan 


en segundos. 


UR 


El campo Nombre puede empezar con la etiqueta para indicar 


que la información del registro se aplica a los dominios que ten- 
| Un 


gan cualquier etiqueta o secuencia de etiquetas en el lugar de 


y no figuren en ningún otro registro. 
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Nota 





Lineas del fichero de datos de un servidor acme.com 


Estas podrían ser algunas líneas del fichero de datos de un 


hipotético servidor de la zona acme . com: 


acme.com. IN SOA servidor.acme.com. admin.acme.com. 
38 ; SERIAL 
7200 ; REFRESH 
600 7; RETRY 
3600000 ; EXPIRE 
60 ) ; MINIMUM 
servidor.acme.com. 
servidor2.acme.com. 
dns.competencia.com. 
10 correo.acme.com. 
20 servidor.acme.com. 
*.acme.com. 10 correo.acme.com. 
servidor.acme.com. 128.52.46.32 
128..32.11..99: 
servidor2.acme.com. 128.52.46.33 
correo.acme.com. 128.52.46.34 











Un uso habitual de los registros PTR es facilitar la obtención del nombre 
de un ordenador a partir de su dirección por medio de un dominio es- 
pecial denominado IN-ADDR.ARPA. El DNS proporciona una opera- 
ción para efectuar consultas inversas; es decir, dado un registro, retorna 
el nombre de dominio a que corresponde. Sin embargo, esta operación 
puede ser muy costosa para el servidor, y no se puede garantizar que la 
respuesta sea única o completa, puesto que puede haber otros servido- 


res que contengan información relacionada. 


No obstante, como la traducción de direcciones IP a nombres es útil e, 
incluso, necesaria, en algunos protocolos (por ejemplo, rlogin y rsh) se 
ha adoptado un mecanismo pora facilitarla que consiste en introducir 
registros adicionales que actúan como índice. De este modo, cada vez 
que se modifica una dirección en la base de datos DNS, o se añade una, 


es necesario actualizar dos registros: 


e El registro A que tiene por nombre el del ordenador. 


e Un registro PTR que tiene un nombre perteneciente al dominio 


IN-ADDR.ARPA. 


Los nombres del dominio IN-ADDR.ARPA pueden tener hasta cua- 
tro etiquetas (sin contar IN-ADDR y ARPA), que representan los valo- 
res posibles de los bytes de una dirección IP en decimal, entre O y 


255. De estas etiquetas, la de nivel más alto corresponde al primer 


byte de la dirección, y la de nivel más bajo, al último byte. De este 
modo, se puede tener una estructura de zonas y autoridades delega- 
das similar a la del resto de los dominios. Un nombre del dominio 
IN-ADDR.ARPA que posea las cuatro etiquetas numéricas corres- 
ponderá a la dirección de un ordenador, y se le asociará un registro 
PTR que apunte al nombre de este ordenador. Los nombres que dis- 
pongan de menos de cuatro etiquetas numéricas serán direcciones 
de redes y podrán tener asociados registros PTR apuntando al nom- 


bre de las pasarelas conectadas a estas redes. 





Nota 





Registros de traducción 


Siguiendo el ejemplo anterior, los registros del dominio IN- 
ADDR.ARPA siguientes podrían servir para llevar a cabo la 


traducción de direcciones a nombres: 


32.46.52.128.IN-ADDR.ARPA. PTR servidor.acme.com. 
33.46.52.128.IN-ADDR.ARPA. PTR servidor2.acme.com. 
34.46.52.128.IN-ADDR.ARPA. PTR correo.acme.com. 
99.11.32.128.IN-ADDR.ARPA. PTR servidor.acme.com. 
46.52.128.IN-ADDR.ARPA. NS servidor.acme.com. 
NS servidor2.acme.com. 
PTR servidor.acme.com. 
11.32.128.IN-ADDR.ARPA. NS servidor.acme.com. 
NS servidor2.acme.com. 





PTR servidor.acme.com. 








| 16.4. Protocolo 


16.4.1. Mecanismos de transporte 


Para acceder al DNS se pueden utilizar los protocolos de transporte UDP 
o TCP. Por norma general, se utiliza UDP en las consultas de los clientes, 
por su simplicidad y por los pocos recursos que requiere. Si no llega la 
respuesta a un datagrama en un tiempo determinado, simplemente se 
retransmite (hasta que haya transcurrido un tiempo máximo). En cam- 
bio, se utiliza TCP cuando conviene asegurar una transmisión fiable; por 
ejemplo, en las transferencias de datos de una zona de un servidor a 
otro. Tanto en un caso como en el otro, el nUmero de puero utilizado 
es el 53. 
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Los nombres del dominio 
IN-ADDR.ARPA son una 


excepción a la sintaxis pre- 
ferida para las etiquetas, 
puesto que deben empezar 
con un dígito. 
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Las consultas y las respuestas se intercambian por medio de mensajes, 


cuyo formato depende del protocolo que se utilice: 


e En UDP, cada mensaje se envía en un datagrama, con una longitud 
máxima de 512 bytes. 


e En TCP, los mensajes se envían prefijados con 2 bytes, que indican 


su longitud, para saber dónde acaban, puesto que lo más normal es 


intercambiar más de uno utilizando una misma conexión. 


16.4.2. Mensajes 


El esquema siguiente muestra la estructura de un mensaje DNS: 





Figura 77. 








Cada mensaje está formado por una cabecera y cuatro secciones 


(pregunta, respuesta, autoridad e información adicional). 


La cabecera consta de los campos siguientes: 


e IDesun número de 16 bits que asigna quién realiza la consulta 
y que se copia en la respuesta para que se sepa a qué consulta 


corresponde. 


QR (Query/Response) es un bit que indica si el mensaje es una con- 


sulta (0) o una respuesta (1). 


OPCODE es un código de operación de 4 bits. En la actualidad, 





hay definidos los de consulta directa (QUERY, código 0), consulta 





inversa (IQUERY, código 1) y petición de estatus (STATUS, código 2). 





Por norma general, el valor de este campo será QUERY, puesto 





que la operación TQUERY es opcional y poco soportada, y la ope- 


ración STATUS no está definida en la especificación RFC 1034. 


AA (Authoritative Answer) es un bit que informa de que el men- 


saje es una respuesta con autoridad. 


TC (Truncation) es un bit que avisa que el mensaje se ha trun- 
cado porque no cabe en un datagrama. Para saber cuál es su 


contenido completo, es preciso utilizar el protocolo TCP. 


RD (Recursion Desired) es un bit que indica que el cliente soli- 


cita respuesta en modo recursivo. 


RA (Recursion Available) es un bit que informa de que el servidor 
soporta el modo recursivo. Si los bits RD y RA valen 1, el men- 


saje es una respuesta recursiva. 


RCODE es un código de respuesta de 4 bits. Los códigos posi- 
bles son: ningún error (0), error de formato (1), error interno 
del servidor (2), dominio inexistente (3), operación no imple- 


mentada (4) o consulta rechazada (5). 


QDCOUNT, ANCOUNT, NSCOUNT, ARCOUNT son números de 
16 bits que indican cuántas entradas hay en cada sección del 
mensaje: pregunta, respuesta, autoridad e información adicio- 


nal, respectivamente. 


Sección de pregunta 
Los mensajes correspondientes a las consultas dispondrán de una o 


más entradas (por lo general, una) en la sección de pregunta. Cada 


entrada está formada por tres campos: 


* QNAME: nombre de dominio del que el cliente desea obtener in- 


formación. 
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* QTYPE: número de 16 bits que indica el tipo de registro de re- 
curso que el cliente quiere obtener como respuesta. El valor de 


dicho campo puede ser cualquiera de los números que pueden 





encontrarse en el campo TYPE de un registro, o uno de los si- 


guientes: 


— XFR (código 252): se utiliza para solicitar la transferencia de 
todos los registros de una zona (cuando un servidor secunda- 


rio quiere refrescar su base de datos). 


— MAILB (código 253): sirve para solicitar todos los registros re- 





lacionados con buzones (MB, MG y MR). 


— * (código 255): sirve para pedir todos los registros de cual- 


quier tipo correspondientes a un nombre. 


* QCLASS: número de 16 bits que indica la clase de registros desea- 
dos. Su valor puede ser el del campo CLASS de los registros o el va- 


lor especial “*” (código 255), que representa todas las clases. 


Sección de respuesta 


Los mensajes correspondientes a las respuestas contienen en la sec- 
ción de respuesta el conjunto de registros de recurso que satisfacen 
los criterios dados por los campos de la consulta. Es decir, el servidor 
envía en la respuesta los registros correspondientes al nombre solici- 
tado que concuerdan con el tipo o con los tipos requeridos y en la 


clase o clases requeridas. 


Un caso especial es el de los alias. Si el nombre solicitado correspon- 








de a un alias y el campo OTYPE es diferente de CNAME, el servidor 
debe repetir automáticamente la consulta sustituyendo el nombre 
original por el nombre canónico. De este modo, el cliente obtendrá 
directamente los datos deseados tanto si utiliza un alias, como si em- 


plea el nombre canónico. 


La respuesta a una petición AXFR consistirá en una secuencia de 
mensajes. El primero debe contener el registro SOA de la zona; en 
los siguientes deben encontrarse el resto de los registros, y el último 
debe ser otra vez el registro SOA, para que el receptor sepa que ya 


ha acabado la transferencia. 


Sección de autoridad 


En una respuesta, la sección de autoridad puede contener registros 
que referencien un servidor con autoridad para responder la consul- 


ta (para el caso de las respuestas en modo no recursivo). 


Sección de información adicional 


La sección de información adicional puede contener otros registros 
de recurso relacionados con la consulta, pero que no forman parte de 


la respuesta. 


16.4.3. Representación de los registros de recurso 


Cuando un mensaje debe contener una cadena de caracteres, se 
representa por medio de 1 byte, que indica su longitud y, a con- 
tinuación, los caracteres de la cadena. Un nombre de dominio se 
representa como una concatenación de cadenas, una para cada 
una de las etiquetas que lo forman. Como los nombres de domi- 
nio acaban con la etiqueta del nodo raíz, una cadena que tenga 
por longitud O (y, por tanto, ningún carácter a continuación) indi- 
ca el final del nombre. Para simplificar la implementación del ser- 
vicio, la especificación RFC 1035 requiere que la longitud total de 


un nombre de dominio no sea superior a 255 bytes. 





Nota 





Representación comprimida de los nombres de 


dominio 


La especificación RFC 1035 también define una repre- 
sentación comprimida de los nombres de dominio cuan- 
do hay muchos iguales, o que acaban igual, en un 
mensaje (como es el caso de los que contienen registros 
SOA). En lugar de una etiqueta, en un nombre puede ha- 
ber 1 byte con los 2 bits de mds peso a 1 (por tanto, no 
se puede confundir con la longitud de una etiqueta, que 
como máximo puede ser 63). Los otros 6 bits y los 8 del 
byte siguiente indican una posición dentro del mensaje 


en que se encuentra la continuación del nombre. 
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La representación de los registros de recurso que pueden aparecer 
en las secciones de respuesta, autoridad e información adicional si- 


gue el formato siguiente: 





Figura 78. 














Los campos que forman los registros de recurso dentro de los men- 


sajes DNS son los siguientes: 


e El campo NAME es el nombre de dominio correspondiente al re- 


gistro. 


+ El campo TYPE es un número de 16 bits que indica el tipo de 


registro, según la tabla siguiente: 








Tabla 7. | 





Número 






































16 TXT 
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El campo CLASS es un numero de 16 bits que indica la clase del 
registro. Por norma general, su valor es 1, que corresponde a la 


clase Internet. 


El campo TTL es un número de 32 bits que indica el tiempo de 


vida del registro en segundos. 


El campo RDLENGTH es un número de 16 bits que indica cuántos 
bytes hay en el campo RDATA. 


El campo RDATA contiene los datos del registro, y su formato de- 





pende del valor del campo TYPE: 


— En los registros A (de la clase Internet), es un número de 32 bits. 








— En los registros CNAME, NS, PTR, MB, MG y MR, es un nombre 


de dominio. 


— En los registros SOA, es una secuencia de dos nombres de do- 








minio (MNAME y RNAME) seguida de cinco números de 32 bits 




















(SERIAL, REFRESH, RETRY, EXPIRE y MINIMUM). 








— En los registros MX, es un entero de 16 bits (la preferencia) se- 


guido de un nombre de dominio. 


— En los registros HINFO, es la concatenación de dos cadenas de 
caracteres. La primera indica el tipo de UCP del ordenador, y 


la segunda, el sistema operativo. 


— En los registros WKS, es un número de 32 bits, como en los re- 
gistros A, seguido de un número de 8 bits que identifica un 
protocolo (por ejemplo, 6 = TCP; 17 = UDP) y una secuencia 
de bits en la que cada bit indica si el ordenador ofrece un de- 


terminado servicio o no. 


— En los registros MINFO, es la concatenación de dos nombres 
de dominio. El primero constituye la dirección del responsable 
del buzón o lista de distribución, y el segundo, la dirección 


donde deben enviarse las notificaciones de error. 
— En los registros TXT, es una cadena de caracteres. 


— En los registros NULL, puede ser cualquier cosa. 
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| 16.5. Implementaciones del DNS 


Prácticamente todos los ordenadores conectados a la red Internet 
incorporan alguna implementación de un cliente DNS (por norma 
general, una librería de funciones llamadas por las aplicaciones) 
para poder acceder a otros ordenadores conociendo los nombres 
de los mismos. Éste es el caso, por ejemplo, de los sistemas Unix o 
GNU/Linux, que proporcionan funciones como gethostbyname 


o gethostbyaddr. 


En muchos sistemas Unix o GNU/Linux también se encuentra dispo- 
nible una utilidad denominada nslookup, que sirve para efectuar 
consultas directamente a un servidor DNS. En el modo de funciona- 


miento básico, acepta comandos como los siguientes: 


e nombre: envía una consulta utilizando el nombre especificado 


m 


como valor del campo QNAME y muestra los resultados obtenidos, 





indicando si la respuesta es sin autoridad. En caso de serlo, infor- 
ma de qué registros ha enviado el servidor en la sección de auto- 


ridad de la respuesta. 


* server servidor: cambia el servidor por defecto al que se en- 


vían las consultas. 


e ls dominio: muestra una lista de nodos del dominio e informa- 
ción asociada; si la lista es muy larga, se puede guardar en un 


fichero añadiendo > fichero. 


e set querytype=tipo: permite cambiar el campo QTYPE de las 





consultas que, por defecto, es A, a cualquier otro valor (NS, MX, 
PTR, CNAME, etc.). 





* set q=tipo: es equivalente a set querytype. 


* set domain=origen: cambia el dominio origen que debe utili- 


zarse cuando se especifica un nombre relativo. 


e set opción: cambia el valor de alguna opción utilizada por el pro- 
grama. Si el valor es recurse, pide que las consultas se lleven a 


cabo en modo recursivo. Si el valor es norecurse, pide que se rea- 


licen en modo no recursivo. Si el valor es vc, pide que se utilicen “cir- 
cuitos virtuales”, es decir, el TCP. Si el valor es novc, pide que se 


empleen datagramas, o lo que es lo mismo, el UDP, etc. 

* set all: muestra el valor actual de los parámetros con que tra- 
baja el programa (servidor por defecto, opciones, lista de nodos 
origen que debe utilizarse cuando se consultan nombres de do- 
minio relativos, etc.). 


e ?: muestra un mensaje de ayuda. 


* exit: acaba el programa. 





Actividad 


Utilizad el programa nslookup para responder a estas 


preguntas: 


a) ¿Cuál es la dirección del ordenador www.uoc.es? 

b) ¿Qué ordenador u ordenadores tienen por alias 
ftp.uoc.es? 

c) ¿Cuál es el servidor DNS del dominio uoc.es ? ¿y 
el del dominio uoc. edu? 

c) ¿Cuál es el servidor del dominio de correo cam- 


pus.uoc.est 
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| 17. Servicios básicos de Internet 


| 17.1. Terminal virtual: el protocolo Telnet 


Uno de los servicios básicos para los que se puede utilizar una red 
de comunicaciones entre computadores es el acceso por medio de 
un terminal. Cuando se desarrollaron los sistemas multiusuario, la 
manera habitual de trabajar en los mismos consistía en utilizar un 
equipo terminal (en un inicio, un teletipo y, más adelante, un dispo- 
sitivo con teclado y pantalla) conectado directamente al ordenador, 
en general por medio de una línea serie. El ordenador debía saber 


qué terminales tenía conectados y cómo podía controlarlos. 


Con la llegada de las redes de comunicaciones, que permitían inter- 
conectar diferentes ordenadores, uno de sus usos naturales era man- 
tener una sesión de trabajo interactiva con un ordenador remoto sin 
necesidad de utilizar los terminales que estuvieran conectados al 
mismo directamente. Para ello, era preciso establecer un protocolo 
que, por un lado, hiciera posible que el ordenador remoto y el siste- 
ma en que quería trabajar el usuario se pudieran comunicar y se en- 
tendieran (es decir, un protocolo en el ámbito de aplicación, puesto 
que el problema del transporte se supone que ya estaba resuelto) y, 
por otro lado, facilitara el control del terminal del usuario desde el 


ordenador remoto. 


Un ordenador puede permitir que se acceda al mismo desde cual- 
quier terminal de cualquier otro ordenador conectado a la red; sin 
embargo, no es práctico que deba saber cómo se controlan todos los 
tipos posibles de terminal. La solución general a estos requisitos se 


basa en el uso de un protocolo de terminal virtual. 
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El hecho de que en una pri- 
mera €poca se utilizaran te- 
letipos es el motivo por el 
cual en UNIX se utilizó la 
abreviación tty (teletype) 
para designar los termina- 
les (básicamente, impreso- 


ras con teclado). 





Lectura complementaria 


Si queréis más información 
sobre el protocolo Telnet, 
consultad la obra siguiente: 


J. Postel; J.K. Reynolds 
(1983, 1 de mayo). RFC 854 
- Telnet Protocol Specification. 


El usuario del terminal pue- 
de ser una persona o un 
proceso. 


Los datos leídos en el primer 


caso por norma general se- 
rán los caracteres tecleados 


y, en el segundo, los que 
vaya generando el proceso. 
La presentación de los datos 


recibidos puede consistir en 
escribirlos en la pantalla, 
enviarlos a la impresora o 
pasarlos al proceso usuario. 
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En el entorno Internet, el protocolo de terminal virtual mds utilizado 
es Telnet, cuya especificación se publicó en 1983 en el estándar RFC 
854. 


17.1.1. Principios básicos del protocolo Telnet 


El protocolo Telnet está basado en el protocolo de transporte TCP. En 
una comunicación Telnet, por norma general se sigue el modelo 
cliente/servidor; es decir, el sistema usuario establece una conexión 
con el sistema proveedor, que está esperando peticiones de conexión 
en un puerto determinado. Se puede utilizar cualquier número de 
puerto para las conexiones y, de hecho, existen muchas aplicaciones 
que utilizan el protocolo Telnet para la comunicación, cada una con 
su propio número. La aplicación básica, sin embargo, consiste en es- 
tablecer una sesión de trabajo interactiva con el sistema servidor y, 


en este caso, el número de puerto utilizado es el 23. 





Cuando se establece la conexión entre el cliente y el servidor, en un 
inicio se supone que la comunicación se produce entre dos NVT. Ello 
significa que tanto el sistema cliente como el sistema servidor deben 
mapear sus características en las de un NVT y suponer que en el otro 
extremo de la conexión hay otro NVT. En el modo de operación nor- 
mal, cada terminal acepta datos del usuario y los envía por medio 
de la conexión establecida en el otro terminal, así como acepta los 


datos que llegan por la conexión y se los presenta al usuario. 
Las características principales de los NVT son las siguientes: 
a) Los datos se intercambian en bytes de 8 bits. Cuando representan 


caracteres, se utiliza la codificación ASCII (por tanto, se envía un 
código de 7 bits en cada byte). 


b) Existen tres caracteres de control que el NVT siempre los interpreta 


c) 


de la manera siguiente: 


e NUL (carácter de control nulo, código 0): no es necesario hacer 


nada. 


+ LF (avance de línea, código 10): mover la posición de escritura 
actual (en una impresora, el carro, y en una pantalla, el cursor) 


una línea adelante manteniendo la posición horizontal. 


e CR (retorno de carro, código 13): mover la posición de escri- 


tura atrás hasta el principio de la línea actual. 


Por tanto, un final de línea (es decir, un salto al principio de la 
línea siguiente) se podría representar con las secuencias CR- 
LF o LF-CR. Sin embargo, para facilitar el mapeo en terminales 
que no tienen funciones separadas para el avance de línea y el 
retorno de carro, el protocolo Telnet especifica que los finales 
de línea deben representarse con la secuencia CR-LF, y los re- 
tornos de carro sin mover la posición vertical, con la secuencia 


CR-NUL. De este modo, cuando el terminal recibe un carácter 





CR, puede esperar a que llegue el siguiente, que deberá ser LF 


o NUL, para saber qué acción debe llevar a cabo. 


Hay cinco caracteres más que opcionalmente pueden ser inter- 


pretados por el NVT y cuyo significado es el siguiente: 








° BEL (timbre, código 7): generar una señal que, por lo general, 





será audible, pero que alternativamente puede ser visible, sin 


mover la posición actual. 





e BS (retroceso, código 8): mover la posición horizontal un es- 


pacio atrás. 


e HT (tabulación horizontal, código 9): mover la posición hori- 


zontal hacia delante hasta la posición de tabulación siguiente. 


e VT (tabulación vertical, código 11): mover la posición vertical 


hacia delante hasta la posición de tabulación vertical siguiente. 


* FF (avance de página, código 12): mover la posición vertical 
hasta el principio de la página siguiente, sin mover la posición 


horizontal. 
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Cualquier otro cardcter de control se considera equivalente a NUL. 


d) El dispositivo NVT es full duplex; sin embargo, por norma general 
trabaja en modo half duplex; es decir, sólo envía los datos del 
usuario cuando ha leído una línea completa o cuando recibe al- 


guna otra señal local que provoque la transmisión. 


e) Si el usuario, de momento, no dispone de más datos para enviar, 
y se han procesado todos los datos recibidos, el terminal puede 
transmitir al sistema remoto una señal, denominada Go Ahead 


(GA), para indicarle que es su turno de enviar datos. 





Nota 





Sólo debería utilizarse la señal GA cuando el otro sistema 
no tuviera otra manera de saber que no debe esperar 
más datos. Una situación típica es que el usuario (cliente) 
genere líneas de una en una y el sistema remoto (servidor) 
envíe respuestas de cero, una o más líneas a cada una. 
En este caso, sólo será necesario que el servidor envíe la 
señal GA para notificar que el control pasa al usuario del 


terminal, y no será preciso que el cliente se lo envíe des- 








pués de cada línea. 


f) El NVT también puede generar, a instancias del usuario, dos se- 





ñales más, denominadas Break (BRK) y Synch. El significado de la 
primera depende de la aplicación. La segunda sirve para cance- 
lar los datos que haya enviado el terminal y todavía no hayan sido 


procesados por el sistema remoto. 


g) Asimismo, existen cinco funciones de control que puede generar el 






NVT a instancias del usuario: Interrupt Process (IP), Abort Output 
(20), Are You There (AYT), Erase Character (EC) y Erase Line (EL). 


Veremos el significado de 
las funciones de control en 
el apartado 18.1.2. 
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La negociación consiste en intercambiar códigos que indican las op- 
ciones del protocolo que cada parte desea o está dispuesta a utilizar. 
Cuatro son los códigos que se utilizan para implementar la negocia- 


ción: 


* DO es una petición que se envía para pedir que se utilice una de- 


terminada opción. 


* WILL es un ofrecimiento que se envía para indicar que el sistema 


está preparado para utilizar una determinada opción. 


e DON’T significa que el sistema no quiere que se utilice la opción 


indicada. 


e WON’ T significa que el sistema no está preparado para utilizar la 


opción indicada. 





Nota 





El mecanismo de negociación es simétrico, de manera 
que cualquiera de las dos partes puede enviar un DO 
o un WILL. Tras enviar un DO, puede recibirse un 
WILL como respuesta positiva o un WON’ T como res- 
puesta negativa. Desde un punto de vista análogo, 
después de enviar un WILL, se puede recibir un DO 
como respuesta positiva o un DON” T como respuesta 
negativa. Ello significa que un DO puede actuar como 
petición o como confirmación si la otra parte ha envia- 


do un WILL, y viceversa. 








Por norma general, la negociación de las opciones se produce al ini- 
cio de la conexión, pero también es posible efectuarla en cualquier 
otro momento. Cada sistema debe empezar a utilizar una opción 


cuando envía o recibe la respuesta positiva correspondiente. 


Este mecanismo de negociación está diseñado para que sea fácil- 
mente extensible. Si un sistema no reconoce una determinada opción 
que se le pide o se le ofrece, simplemente debe contestar con WON’ T 


oO DON’T. 
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Las opciones Telnet posibles 
no estan definidas en la es- 


pecificación del protocolo, 


sino en especificaciones in- 
dependientes. 





Muchas opciones definen 
sus comandos para la sub- 
negociación, como IS (pa- 


ra enviar el valor de un 
parámetro), SEND (para pe- 
dir que la otra parte lo en- 
vie), etc. 
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En ocasiones se necesita más información para negociar una opción, 
como el valor de algún parámetro. En este caso, en primer lugar de- 


ben ponerse de acuerdo las dos partes con el mecanismo básico de 





los DO/ DON' T/WILL/WON” T para utilizar la opción deseada y, una 
vez se haya aceptado, debe llevarse a cabo una subnegociación de 
los valores de los parámetros utilizando una sintaxis específica de 


cada opción. 


17.1.2. Comandos del protocolo Telnet 


En los datos intercambiados entre dos sistemas que se comunican 
con el protocolo Telnet, se pueden intercalar ciertos comandos 
propios del protocolo, tales como la señal GA o los códigos de ne- 
gociación. Para distinguir los comandos de los datos normales, 
los primeros deben ir prefijados con un código especial llamado 
IAC (Interpret As Command), que se representa con un byte igual 
a 255. 


Por consiguiente, cada comando se representa con una secuencia de 
dos bytes, en la que el primero es el código IAC, y el segundo, el có- 
digo propio del comando, excepto los comandos de negociación, 
que disponen de un tercer byte que sirve para indicar a qué opción 
se refieren. Para representar un byte normal de datos que sea igual 
a 255, es preciso prefijarlo con un código lAC. Cualquier otro byte 


de datos se representa directamente con su código. 


Los comandos definidos en el protocolo Telnet son los siguientes: 


* NOP (No Operation, código 241): operación nula. 
* GA (Go Ahead, código 249): señal GA. 


° BRK (Break, código 243): señal BRK. 





* DO (código 253) + código opción: código de negociación DO. 
* DON'T (código 254) + código opción: código de negociación DON” T. 


* WILL (código 251) + código opción: código de negociación WILL. 








e WON'T (código 252) + código opción: código de negociación WON” T. 





e SB (Subnegotiation Begin, cédigo 250) + código opción: los datos 
que vengan a continuación corresponden a la subnegociación de 


una opción. 


* SE (Subnegotiation End, código 240): indica el fin de los datos de 





subnegociación. 


e DM (Data Mark, código 242): indica en qué punto de la secuencia 


de datos se ha enviado una señal Synch. 


e TP (Interrupt Process, código 244): código de función que puede 
enviar el usuario para indicar al sistema remoto que interrumpa 


el proceso que está ejecutando. 


e AO (Abort Output, código 245): código de función que sirve para 
indicar que se continúe ejecutando el proceso remoto, pero que 


deje de enviar al usuario los datos que genera. 


e AYT (Are You There, código 246): código de función que pide al 
sistema que, cuando lo reciba, conteste con algún mensaje que 
sirva al usuario para verificar que la conexión continúa estableci- 
da (por ejemplo, cuando el proceso que ejecuta tarda en generar 


una respuesta). 





e EC (Erase Character, código 247): código de función que sirve 


para borrar el último carácter escrito en el terminal. 





° EL (Erase Line, código 248): código de función que sirve para bo- 


rrar toda la línea actual. 


El protocolo Telnet también proporciona un mecanismo para trans- 
mitir la señal Synch. Esta última no se representa con un comando 
como los otros, dado que debe tener un efecto inmediato. En este ca- 
so, se envían datos urgentes TCP acabados con un código DM y, en 
la secuencia de datos normales, se inserta otro código DM. Al recibir 
los datos urgentes, el sistema remoto pasará a procesar los datos 
normales en modo urgente (que puede consistir en descartar todo lo 
que haya en estos datos, salvo los comandos especiales) hasta que 


encuentre el DM. 


El terminal puede generar automáticamente una señal Synch cuando 


el usuario envía alguna de las funciones que requieren atención in- 











mediata, como IP, AO o AYT (pero no EC o EL). 
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Las nombres de los coman- 
dos se pueden abreviar 


siempre que la abreviatura 
no genere ambigüedades. 
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17.1.3. Implementaciones del protocolo Telnet 


Hay implementaciones de servidores Telnet prácticamente en todos 
los sistemas multiusuario que utilizan el protocolo TCP. Los clientes 
Telnet son más numerosos todavía, porque también hay para siste- 


mas monousuario. 


Un ejemplo de implementación de cliente Telnet es la utilidad del sis- 
tema operativo GNU/Linux denominada precisamente telnet. Si 
se llama sin argumentos, entra en modo comando. Con un argu- 
mento, que puede ser una dirección IP o un nombre de servidor, es- 
tablece una conexión con el puero Telnet (el 23) de este servidor y 
entra en modo conexión. Con un segundo argumento, que puede ser 
un número de puerto o un nombre de servicio, establece la conexión 


con este puerto. 


Cuando el número de puerto utilizado es el 23, el cliente inicia auto- 
máticamente el proceso de negociación enviando los códigos DO y 
WILL correspondientes a las opciones que soporta. Con cualquier 
otro puerto, por norma general no se envía ningún código de nego- 


ciación, salvo que se reciba alguno del sistema remoto. 


Cuando el programa está en modo conexión, envía al sistema remo- 
to cada carácter que teclea el usuario. Desde el modo conexión se 
puede pasar al modo comando por medio del carácter de escape, que 
suele ser “”]”. En este modo, el programa admite, entre otros, los co- 


mandos siguientes: 


e open: establece una conexión con el servidor, y opcionalmente 


con el puerto, indicado en los argumentos de este comando. 


e comando nulo (línea vacía): si hay una conexión establecida, sale 


del modo comando y vuelve al modo conexión. 


* send: envía al sistema remoto el código Telnet indicado por el argu- 


mento, que puede ser ao, ayt, brk, ec, el, ga, ip, synch, etc. 


e “5]” (o el carácter que actúe como carácter de escape): envía este 


último al sistema remoto (equivale a send escape). 


e ?: muestra un mensaje de ayuda. 


e quit: cierra la conexión, en caso de haber conexión establecida, 
y acaba el programa (que también acaba cuando el sistema re- 


moto cierra la conexión). 





Actividad 


Con algunas implementaciones Unix del cliente 
Telnet, se puede utilizar el comando toggle netdata 
para ver el diálogo de la negociación. Probad esta 
otra opción en una sesión interactiva (en el puerto por 
defecto 23) y en una conexión a otro puerto (por ejem- 


plo, echo). 








17.2. Terminal virtual en GNU/Linux: 
el protocolo rlogin 


Cuando se desea establecer una sesión de trabajo interactiva desde 
un sistema Unix con otro sistema Unix, además de utilizar el protocolo 
Telnet, también existe la posibilidad de utilizar el protocolo llamado 
rlogin. Este último se desarrolló en un inicio en el entorno de las utili- 
dades de comunicaciones de la variante de Unix llamada BSD; sin em- 
bargo, hoy día hay implementaciones disponibles en todas las 
variantes, así como en otros sistemas operativos. La especificación del 


protocolo rlogin está publicada en el documento RFC 1282. 


Las características principales que diferencian el protocolo rlogin del 


protocolo Telnet son las siguientes: 


a) El servidor siempre es informado del tipo de terminal con que tra- 


baja el cliente sin necesidad de negociación. 


b) El servidor también es informado de la identidad del usuario en 
el sistema cliente, lo que se puede utilizar para automatizar el 


proceso de autenticación. 


c) Si cambian los tamaños de la ventana de presentación del termi- 
nal, se puede enviar automáticamente una señal al servidor para 


notificárselo. 
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Lectura complementaria 





Para obtener más informa- 
ción sobre el protocolo rlogin, 
consultad la obra siguiente: 
B. Kantor (1991, diciem- 
bre). RFC 1282 - BSD Rlogin. 
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d) En la transmisión de datos, siempre pueden utilizarse los 8 bits de 


cada byte. 


17.2.1. Conceptos básicos del protocolo rlogin 


El protocolo rlogin utiliza conexiones TCP. El nombre oficial del ser- 
vicio proporcionado por este protocolo es login y el número de 


puerto asignado a este servicio es el 513. 


Cuando el cliente establece la conexión con el servidor, en primer lu- 
gar le envía cuatro cadenas de caracteres, cada una acabada con un 


carácter NUL (código 0). Son las cadenas siguientes: 


e Una cadena vacía (sólo contiene el carácter NUL). 

e El nombre del usuario en el sistema cliente. 

e El nombre de usuario con que se quiere establecer la sesión de 
trabajo en el sistema servidor. 

e El tipo de terminal y, separado con “/”, su velocidad (por ejem- 
plo, vt100/9600). 


Cuando ha recibido estas cuatro cadenas, el servidor envía un carác- 
ter NUL y empieza la transferencia de datos entre cliente y servidor 
en modo control de flujo. En este modo, el cliente envía los caracteres 
que teclea el usuario tal como le llegan, excepto los caracteres de 
control DC3 (“^s”) y DC1 (“^Q”), que significan ‘suspender la trans- 


misión’ y ‘retomarla’, respectivamente. 


Por otro lado, el cliente presenta los datos que envía el servidor tal 
como le llegan. El cliente también puede recibir mensajes de control 
del servidor, que se representan con un código de un byte enviado 
en datos urgentes TCP. El cliente debe responder a estos mensajes 
de manera inmediata y suspender temporalmente el procesado de 


otros datos que pueda haber recibido. 


17.2.2. Implementación del protocolo rlogin 


En los sistemas GNU/Linux hay una utilidad llamada rlogin que ac- 


túa como cliente del protocolo rlogin. Es preciso que se le especifique 


el nombre del servidor remoto y, de manera optativa, el nombre de 
usuario que debe utilizar en este servidor, con la opción -1 (por defec- 


to, se utiliza el mismo nombre de usuario que en el sistema local). 


La mayoría de los servidores rlogin implementan la autenticación au- 


tomática de la manera siguiente: 


e Si el usuario remoto tiene en su directorio un fichero llamado 
.rhosts con una línea en la que se encuentre el nombre del or- 
denador cliente y, opcionalmente, el nombre del usuario cliente 
(en ausencia de este nombre de usuario, se toma el del usuario 
en el servidor), se inicia directamente la sesión interactiva sin ne- 


cesidad de pedir ninguna contraseña. 


* Si no dispone de este fichero, se consulta otro, el /etc/ 
hosts.equiv, para ver si existe alguna línea con el nombre del 
ordenador cliente (en este caso, debe coincidir el nombre del 
usuario en el cliente y en el servidor) y, si está, también se da al 


usuario por autenticado. 


e En cualquier otro caso, se sigue el procedimiento normal de au- 


tenticación mediante contraseña. 





Nota 





Por motivos de seguridad, los servidores rlogin suelen 
requerir que el fichero .rhosts tenga permiso de lec- 
tura sólo para el usuario a quien pertenece. Por otro 
lado, los nombres de servidores en los ficheros 
.rhosts y /etc/hosts.equiv no pueden ser alias, 
deben ser los nombres oficiales. Y, como precaución 
adicional, el fichero /etc/hosts.equiv sólo se uti- 
liza cuando el nombre del usuario en el servidor es di- 


ferente de root. 








Antes de consultar los ficheros .rhosts y /etc/hosts.equiv, el 
servidor siempre comprueba que el cliente se haya conectado desde 
un puerto reservado (con número inferior a 1024). En caso contrario, 
no se permite la autenticación automática, puesto que la conexión 
podría provenir de otro usuario que estuviera ejecutando un progra- 
ma que siguiese el protocolo rlogin, pero que enviase información 


falsa sobre su identidad. 
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La autenticación automática puede resultar cómoda porque ahorra 
teclear las contraseñas, pero también puede ser una fuente de pro- 


blemas si no se utiliza con precaución. 


Además de leer los caracteres tecleados y enviárselos al servidor, 
el cliente también puede recibir comandos del usuario. Para dis- 
tinguirlos de los caracteres normales, se representan con un ca- 
rácter precedido del símbolo “~”. Esta secuencia sólo se reconoce 
al inicio de las líneas (es decir, inmediatamente a continuación de 
un salto de línea). El carácter del comando puede ser, por ejem- 


plo, el siguiente: 


e “^Z” (o el carácter correspondiente a la función SUSP del termi- 
nal): suspende la ejecución del programa cliente, con la posibili- 
dad de retomarla más adelante (la manera de hacerlo puede 


depender del shell, pero por lo general es con el comando fg). 


e “^y” (o el carácter correspondiente a la función DSUSP del termi- 
nal): suspende el envío de datos al servidor y, por consiguiente, el 
teclado queda disponible para otros procesos; sin embargo, la re- 
cepción continúa (si se reciben nuevos datos, se mostrarán cuan- 


do lleguen). 


di 


"—": envía el carácter —. 
e “.”: cierra la conexión. 


Si el carácter no corresponde a ningún comando reconocido por el 
cliente, se envía al servidor tal como ha llegado, precedido por el ca- 


rácter “~”. 


| 17.3. Otros servicios 


17.3.1. Ejecución remota con autenticación automática: rsh 


Paralelamente al servicio de terminal virtual, que permite mantener 


una sesión de trabajo en un sistema remoto, en los sistemas Unix 
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BSD se desarrolló otro servicio que permite ejecutar un comando en 


el sistema remoto. El programa que actúa como cliente de este ser- 


vicio se llama rsh (remote shell). 


El nombre oficial de este servicio es shel1, el protocolo de transpor- 


te utilizado es el TCP y el número de puerto asignado es el 514. 


A continuación presentamos los pasos que se siguen en este protocolo: 


1) 


2) 


3) 


4) 


5) 


6) 


7) 


El servidor comprueba que el cliente se haya conectado desde un 


puerto reservado. En caso contrario, cierra la conexión. 


El cliente envía al servidor una cadena acabada en NUL que con- 


tiene un número decimal: 


Si es diferente de cero, se interpreta como un número de puerto y el 
servidor establece en este puerto una conexión secundaria (esta se- 


gunda conexión se establece también desde un puerto reservado). 


Si es cero, la misma conexión principal actúa también como se- 


cundaria. 


El cliente envía tres cadenas más acabadas en NUL con el nombre 
del usuario en el sistema servidor, el nombre en el sistema cliente 


y el comando a ejecutar. 


El servidor comprueba en los ficheros .rhosts y/o /etc/ 
hosts.equiv que el usuario esté autorizado para la autentica- 


ción automática. 


Si lo está, el servidor envía un carácter NUL por la conexión se- 


cundaria; en caso contrario, cierra las conexiones. 


El servidor ejecuta el comando indicado con la identidad del usuario 
indicado. Los datos que escriba este comando por la salida estándar 
(stdout en la nomenclatura del lenguaje C) se enviarán por la co- 
nexión principal, y los que escriba por la salida de error (stderr), 
por la conexión secundaria. Las que envíe el cliente serán accesibles 


por la entrada estándar (stdin). 


Cuando acabe la ejecución del comando, el servidor cerrará la co- 


nexión. 
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17.3.2. Ejecución remota: rexec 


Con rsh, el usuario debe estar autorizado por medio de los ficheros 
.rhosts o /etc/hosts.equiv del sistema remoto para poder eje- 
cutar un comando en el mismo. Existe otro servicio muy parecido en que 
no se utiliza la autenticación automática, sino que siempre requiere que 
el usuario proporcione su contraseña en el sistema remoto. En algunos 
sistemas Unix, se encuentra disponible un programa llamado rexec que 
actúa como cliente de este servicio. En otros, sólo hay una función de la 


librería estándar, rexec, que implementa el protocolo. 


El nombre oficial de este servicio es exec, el protocolo de transporte 


utilizado es el TCP y el número de puerto asignado es el 512. 


Este protocolo es muy parecido al anterior: las Únicas diferencias son 
que, en lugar de enviar el nombre del usuario, en el sistema cliente se 
envía la contraseña del usuario en el sistema servidor (los ficheros 
.rhosts y /etc/hosts.equiv no se consultan) y que no es preci- 


so verificar que las conexiones provengan de puertos reservados. 


17.3.3. Servicios triviales 


La mayoría de los sistemas Unix y GNU/Linux proporcionan una 
serie de servicios denominados triviales, que se pueden utilizar 
para llevar a cabo pruebas de funcionamiento de los módulos que 
implementan los protocolos de transporte. Todos son accesibles 
por medio de TCP y UDP, y el número de puerto utilizado en am- 
bos casos es el mismo. Algunos ejemplos de servicios triviales son 


los siguientes: 


e echo (puerto 7): retorna todos los bytes (en TCP) o datagramas 
(en UDP) que recibe (RFC 862). 


e discard (puerto 9): lee datos (bytes o datagramas), pero no 
hace nada más (RFC 863). 


* chargen (puerto 19): en TCP, cuando se establece la conexión, 
el servidor empieza a enviar una secuencia de caracteres hasta 
que el cliente la cierra y, en UDP, cuando el servidor recibe un da- 


tagrama, responde con otro que contiene un nombre arbitrario 


de caracteres (RFC 864). 


e daytime (puerto 13): cuando se establece la conexión, o se reci- 
be un datagrama, el servidor envía la fecha y la hora actual en 


formato legible para los humanos (RFC 867). 


e time (puerto 37): cuando se establece la conexión, o se recibe un 
datagrama, el servidor envía un número de 4 bytes que represen- 
ta el número de segundos transcurridos desde el 1 de enero de 
1970 a las O horas GMT (RFC 868). 


Finger 


Name / Finger es otro ejemplo de servicio sencillo que permite obtener 
información de un usuario en un sistema remoto. La especificación del 


protocolo para este servicio está recogida en el documento RFC 742. 


El nombre oficial de este servicio es finger, el protocolo de transporte 


utilizado es el TCP y el número de puerto asignado es el 79. 


El programa cliente se llama finger y, por norma general, admite ar- 


gumentos de la forma usuario, usuario@host 0 @host: 


e En el primer caso, proporciona información sobre un usuario en 


el sistema local sin necesidad de utilizar ningún protocolo. 
e Enel segundo, informa sobre un usuario de un sistema remoto. 


+ En el tercero, normalmente ofrece una información resumida de 
los usuarios que están actualmente conectados con sesiones inte- 


ractivas al sistema remoto. 


Cuando se establece la conexión, el cliente simplemente envía una 
línea al servidor acabada con CR=LF. En esta última se encuentra el 
nombre del usuario de quien se quiere obtener información. Si no hay 
ningún nombre, se entiende que la solicitud se refiere a todos los 


usuarios que estén conectados. 


El formato de la respuesta depende de la implementación del servi- 
dor y puede incluir información como el nombre del usuario, su 


nombre real, cuándo se conectó por última vez, cuándo recibió o 
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leyó el correo por última vez, etc., y, si está conectado actualmente, 
desde dónde, en qué terminal, cuánto tiempo hace que no hay acti- 
vidad en su terminal, etc. La información retornada normalmente es 
un subconjunto de todos estos campos; sin embargo, si la línea de 
petición empieza con los caracteres “/1w”, el servidor puede retornar 


información más completa. 


| 18. Transferencia de ficheros 





18.1. FTP: protocolo de transferencia 
de ficheros 


Una de las primeras aplicaciones básicas desarrolladas en el entor- 
no de lo que después sería la red Internet fue la transferencia de fi- 
cheros entre diferentes sistemas. Al principio de los años setenta ya 
se elaboraron las primeras especificaciones del protocolo más utili- 
zado para esta finalidad, el FTP. Después de algunas modificaciones 
y mejoras, la especificación oficial del protocolo se publicó en 1985 
en el documento RFC 959. 


El FTP se basa en el modelo cliente/servidor y permite la transferen- 
cia de ficheros tanto del servidor al cliente, como del cliente al servi- 
dor. Asimismo, permite que un cliente efectúe transferencias directas 
de un servidor a otro, con lo que se ahorra la necesidad de copiar 
los ficheros del primer servidor al cliente y pasarlos después del clien- 


te al segundo servidor. 


El protocolo proporciona también operaciones para que el cliente 
pueda manipular el sistema de ficheros del servidor: borrar ficheros 
o cambiarles el nombre, crear y borrar directorios, listar sus conteni- 


dos, etc. 


Uno de los objetivos principales de este protocolo consiste en permitir 
la interoperabilidad entre sistemas muy distintos, escondiendo los 
detalles de la estructura interna de los sistemas de ficheros locales y 


de la organización de los contenidos de los ficheros. 





Nota 





Algunos de los sistemas utilizados en la época de 


desarrollo del FTP actualmente están obsoletos; por 
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Lectura complementaria 


Para más información sobre 
el FTP, consultad la obra si- 
guiente: 


J. Postel; J. Reynolds 
(1985, octubre). RFC 959 - 
File Transfer Protocol. 
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ejemplo, los que utilizan palabras de 36 bits o códi- 
gos de caracteres incompatibles con el estándar AS- 
Cll o los que almacenan los ficheros en “páginas” 
no necesariamente contiguas. De hecho, muchas de 
las implementaciones actuales del protocolo no so- 
portan estas características especiales previstas en 


la especificación. 








18.1.1. El modelo del FTP 


En el modelo general descrito en la especificación del FTP, tanto 


en el servidor como en el cliente hay dos entidades que intervie- 


nen en la transferencia de ficheros: 


a) 


b) 


El intérprete de protocolo se encarga del intercambio de los 
comandos del protocolo. En la parte del cliente, las operacio- 
nes que el usuario solicita por medio de la interfaz de usuario, 
el intérprete las convierte en una secuencia adecuada de co- 


mandos FTP y se envían al servidor. 


En la parte del servidor se interpretan los comandos recibidos, se 
generan las respuestas correspondientes y se envían al cliente. 
Por tanto, el intérprete cliente debe analizar estas respuestas, por 
ejemplo, para informar al usuario del resultado de la operación 


o para proseguir la secuencia de comandos FTP. 


El proceso de transferencia de datos, que está bajo el control 
del intérprete de protocolo, se encarga de intercambiar los da- 
tos que deben transferirse, es decir, los contenidos de los fiche- 


ros o bien los listados de los directorios. 


Tanto en la parte del cliente, como en la del servidor este pro- 
ceso interactúa directamente con el sistema de ficheros locales 


para leer sus datos o para almacenarlos en los mismos. 





Figura 79. 











Modelo funcional del protocolo FTP 





Los dos intérpretes de protocolo se comunican mediante una conexión 
TCP llamada conexión de control. Cuando deben transferirse datos de 
un sistema al otro, se establece otra conexión TCP entre los dos procesos 
de transferencia de datos denominada conexión de datos. Generalmen- 
te, la parte activa de esta conexión (la que la inicia) constituye el proceso 


de transferencia del servidor, y la parte pasiva, el del cliente. 


La figura siguiente muestra la variación del modelo general para 
el caso en que un cliente controle una transferencia entre dos ser- 
vidores (uno de los cuales actuará como servidor activo y el otro, 


como servidor pasivo): 





Figura 80. 
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El FTP permite efectuar mds 
de una transferencia en una 
Única sesión. Según el modo 
de transmisión, es posible 
que se abran y se cierren di- 


ferentes conexiones de datos 
durante una misma co- 
nexión de control, o bien que 
se utilice la misma conexión 
de datos para las diferentes 
transferencias. 





Consultad la descripción de 
las reglas especificadas por 
el protocolo Telnet (RFC 
854) en el apartado 18.1 de 
la unidad anterior. 


Las excepciones a la regla 
de la respuesta secuencial 
son los comandos obtener 
el estado actual 
transferencia, abortar una 
operacion y cerrar la sesidn. 


de una 





Algunas implementaciones 
de servidores FTP soportan 


otros códigos de comandos 
no estándares, que pueden 
tener mds de cuatro letras. 
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18.1.2. Conceptos básicos del FTP 


El FTP está basado en conexiones TCP. El intérprete de protocolo del 
servidor debe estar preparado para recibir peticiones de conexión en 
un puerto TCP que, por defecto, es el asignado oficialmente al servi- 


cio FTP: el número 21. 


El intérprete de protocolo del cliente establece una conexión de con- 
trol con el puerto del intérprete servidor. En esta conexión se utilizan 
las reglas especificadas en el protocolo Telnet. Ello significa que, por 
defecto, los intérpretes de protocolo se intercambian mensajes codi- 
ficados con bytes de 8 bits, según el juego de caracteres ASCII, y re- 


presentan los finales de línea con la secuencia <CRLF>. 


Los comandos FTP constituyen los mensajes que envía el intérprete 
cliente, y los que envía el intérprete servidor son respuestas a dichos 
comandos. Las respuestas se generan siguiendo el orden en que el 
cliente envía los comandos, puesto que en general el servidor efectúa 
las operaciones de manera secuencial (no empieza una nueva ope- 
ración hasta que no ha acabado la anterior). A continuación, anali- 


zamos por separado los comandos y las respuestas: 


1) Comandos FTP: un comando FTP se representa por medio de un 
código de comando de hasta cuatro letras (que pueden ser indis- 
tintamente mayúsculas o minúsculas), seguido de una lista de 
cero o más argumentos, separados por espacios, acabada con un 


final de línea. 


La especificación RFC 959 define treinta y tres comandos agrupados 
en tres categorías diferentes (representamos entre paréntesis el códi- 


go correspondiente a cada comando): 


a) Comandos de control de acceso: nombre de usuario (USER), 





contraseña (PASS), cuenta (ACCT), cambiar de directorio (CWD), 
cambiar al directorio padre (CDUP), montar un sistema de ficheros 


(SMNT), reinicializar (REIN), acabar la sesión (QUIT). 


b) Comandos de parámetros de transferencia: estructura de fiche- 








ro (STRU), modo de transmisión (MODE), tipo de representación 


(TYPE), puerto de datos (PORT), puerto pasivo (PASV). 


c) 


2) 


El 


Comandos de servicio FTP: obtener (RETR), almacenar (STOR), 


almacenar con nombre único (STOU), añadir (APPE), listar 





(LIST), listar nombres (NLST), mostrar el directorio actual (PWD), 





reservar espacio (ALLO), abortar (ABOR), retomar (REST), borrar 





(DELE), nombre antiguo (RNFR), nombre nuevo (RNTO), crear un 
directorio (MKD), borrar un directorio (RMD), estatus (STAT), siste- 











ma (SYST), servicios adicionales (SITE), ayuda (HELP) y opera- 
ción nula (NOOP). 


Respuestas FTP: las respuestas constan de un código numérico 
de tres dígitos decimales, que permite al intérprete del protocolo 
cliente saber cuál es el resultado de la operación, seguido de un 


texto explicativo destinado al usuario humano. 


texto explicativo del mensaje de respuesta puede tener una línea o 


7 


mas: 


Si tiene una línea, la respuesta se representa con el código numé- 
rico seguido del carácter espacio y, a continuación, el texto y un 


final de línea. 


Si tiene más de una línea, la primera se representa con el código 


un 


numérico seguido del carácter y, a continuación, las líneas de 
texto, acabadas con finales de línea, la última de las cuales debe 
empezar con el mismo código numérico de la primera línea se- 


guido del carácter espacio. 





Ejemplo 





Ejemplo de respuesta de una sola línea: 


220 Sistema preparado. Introducid nombre de 


usuario y contrasefia. 


Ejemplo de respuesta con multiples lineas: 


220-Sistema preparado. 
Introducid el nombre de usuario y la 
contrasefia para acceder a los ficheros 
restringidos, © utilizad el nombre 
"anonymous" 


220 para acceder al directorio público. 
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De este grupo de comandos 


de servicio, los seis siguien- 


tes son los comandos de 
transferencia; es decir, los 
que utilizan la conexión de 
datos. 


RETR 
STOR 
STOU 
pM ed ed 
LIST 
NLST 





La estructura de los cédigos 
de respuesta y el significado 
de cada digito son comunes 
a todos los protocolos. Po- 


déis encontrar una explica- 
ción de los mismos en el 
anexo 4. 
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La especificación RFC 959 define los códigos de respuesta posibles 


para cada uno de los comandos y su significado. 








Tabla 8. 





Códigos de respuesta 


Significado 





Marca de reanudación. 





Esperar hasta que el servidor esté preparado. 





El servidor transfiere datos (la conexión de datos ya está abierta). 


El servidor establece la conexión de datos e inicia la 
transferencia. 





Operación efectuada. 





Comando innecesario en este servidor. 





Información de estado del sistema o mensaje de ayuda del 
sistema. 


Información de estado del directorio. 





Información de estado del fichero. 


Mensaje de ayuda (destinado al usuario humano). 





Tipo de sistema. 





Servidor preparado. 





El servidor cierra la conexión de control. 


Operación efectuada y conexión de datos cerrada. 





El servidor está en modo pasivo (h1,h2,h3,h4,p1,p2). 





Proceso de autenticación completado satisfactoriamente. 





Operación de fichero efectuada. 





El directorio es el resultado de la operación. 





Enviar contraseña. 





Enviar cuenta. 





Enviar el comando siguiente para completar la operación. 





Servicio no disponible (por ejemplo, por time out...), conexión de 
control cerrada. 





No se puede establecer la conexión de datos. 





Transferencia abortada y conexión de datos cerrada. 
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No se puede efectuar la operación sobre el fichero (por ejemplo, 
fichero ocupado). 





Espacio de disco insuficiente: transferencia no iniciada. 





500 





Error de sintaxis en el comando. 





Códigos de respuesta 
































Código Significado 
501 Error en los argumentos. 
502 Comando no implementado. 
503 Error en la secuencia de comandos (este comando no 
corresponde). 
504 Argumento no soportado. 
530 El usuario no se ha autenticado correctamente. 
532 Se necesita cuenta para esta operación. 
550 e se puede acceder al fichero o directorio (no existe, acceso 
enegado, etc.). 
552 Espacio de disco insuficiente: transferencia abortada. 
553 Nombre de fichero no permitido. 





Cuando ha establecido la conexión de control con el intérprete de pro- 
tocolo del servidor y antes de enviar ningún comando, el cliente debe 
esperar a recibir una respuesta, que puede tener los códigos 220, 421 
ó 120. Si el código es 120, el cliente debe esperar hasta que el servidor 
envíe una respuesta 220. Cuando el servidor indique que está prepara- 
do, puede empezar el intercambio de comandos y respuestas. Por nor- 
ma general, el servidor cerrará la conexión de control cuando se lo 


solicite el cliente (con el comando de acabar sesión). 


Si el cliente desea realizar operaciones de transferencia, su proceso 
de transferencia de datos debería estar preparado para recibir peti- 
ciones de conexión en un puerto TCP, que por defecto es el mismo 


desde el que el intérprete ha iniciado la conexión de control. 


El encargado de establecer las conexiones de datos es el proceso 
de transferencia de datos del servidor, desde su puerto de datos. 
Por defecto, este puerto es L — 1 (donde L es el número de puerto 
correspondiente a la conexión de control). Es decir, si el servidor ha 
recibido la conexión de control en el puerto 21, su puerto de datos 
por defecto será el 20. Evidentemente, el cliente puede solicitar el uso 
de puertos diferentes de los predeterminados por medio de los co- 


mandos adecuados. 


Generalmente, las conexiones de datos las cierra el servidor, excepto 


cuando sea la otra parte (el cliente o un servidor pasivo) quien envíe 
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El texto explicativo de las 
respuestas es de formato li- 
bre, excepto en el caso de 


las respuestas 110 (coman- 
do RETR), 227 (comando 
PASV) y 257 (comandos 
PWD y MKD). 
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los datos y el modo de transmisión utilizado requiera el cierre de la 


conexión para indicar el final del fichero. 


18.1.3. Funcionalidad del FTP 


Las acciones que lleva a cabo el servidor para cada uno de los co- 


mandos definidos en la especificación RFC 959 son los siguientes: 
1) Nombre de usuario (USER) 


El argumento de este comando es el nombre que es preciso sumi- 
nistrar al sistema servidor para identificar al usuario con el obje- 
tivo de acceder a los ficheros. Éste suele ser el primer comando 
que envía el cliente. Asimismo, es posible enviarlo en medio de 
una sesión; entonces el servidor se olvida de la identidad del 
usuario anterior y realiza las nuevas operaciones bajo el nombre 


del nuevo usuario. 


Si el servidor envía la respuesta 230, significa que el proceso de au- 
tenticación ya se ha completado; si envía la 530, significa que este 
usuario no es admisible (por ejemplo, porque no hay ningún ususa- 
rio con este nombre) y, si envía la 331 o la 332, entonces se necesita 


una contraseña o una cuenta, respectivamente. 





Nota 





En muchos sistemas, un intento de conexión con un 
nombre de usuario inexistente dará como resultado 
una respuesta 331, para no proporcionar información 
a los usuarios ajenos al sistema sobre qué nombres 


son válidos y cuáles no. 


El código 332 indica que la operación solicitada se lleva- 


rá a cabo tan pronto como se reciba el comando ACCT. 








2) Contraseña (PASS) 


El argumento de este comando es la contraseña que necesita el sis- 
tema servidor para verificar la identidad del usuario. Si no se necesita 


ninguna, la respuesta será 202; si se necesita pero es incorrecta, 


530, y si es correcta, puede ser 230 (autenticación completada) o 


332 (se necesita una cuenta). 


3) Cuenta (ACCT) 


Algunos sistemas pueden requerir que el usuario proporcione una 
identificación de cuenta, bien en el proceso de autenticación inicial, 
bien para efectuar determinadas operaciones, como almacenar fi- 
cheros. El servidor hará saber que necesita esta información envian- 
do una respuesta 332 en el proceso de autenticación, o una 


respuesta 332 o 532 después de una determinada operación. 


4) Estructura de fichero (STRU) 


Este comando sirve para especificar cómo estarán estructurados los 
ficheros que deben transferirse. El tipo de estructura afecta al modo 
de transmisión, como veremos a continuación. Los valores posibles 


del argumento son los tres siguientes: 


R: el fichero consta de una secuencia de registros. 


P: la estructura se basa en páginas indexadas. (La opción P era 
útil en los sistemas de la época en que se desarrolló el FTP; hoy 


día está prácticamente en desuso.) 


e F: el fichero se considera simplemente una secuencia de bytes (en 


este caso se considera que sólo hay estructura de fichero). 


Si no se utiliza el comando STRU, el tipo de estructura por defecto es F. 


5) Modo de transmisión (MODE) 


El argumento indica cómo se transmitirán los ficheros. Puede tener 


los valores siguientes: 





e B: la transmisión se lleva a cabo en bloques de datos, cada uno 
precedido de una cabecera con la longitud del bloque (2 bytes) y 
un código descriptor (1 byte). Este último sirve para indicar, por 


ejemplo, si el bloque es el último de un registro o del fichero. 
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e C: la transmisión se realiza en bloques más compactos, con cabe- 
ceras de un solo byte, y permiten codificar una secuencia de hasta 


64 bytes repetidos en un bloque de 2 bytes. 


e s: la transmisión se efectúa en modo stream; es decir, como 


— una simple secuencia de bytes. Si se utiliza con el tipo de es- 
La combinación modo i i PAN 
tructura en registros, se insertan códigos de control en la se- 


stream y estructura de fiche- 


SE AO cuencia para señalar los finales de registro y de fichero. Si el 
cerrar la conexión de datos 


después de cada transferen- 


cia. En los otros casos, el stream, la única manera de indicar el final de fichero es cerran- 
servidor puede optar entre 


tipo de estructura es de fichero y la transmisión es en modo 


: do la conexión de datos. 
mantenerla abierta o ce- 


rrarla, e informa de la mis- 
ma al cliente con una 
respuesta 250 o 226, res- 
pectivamente. es S. 





Si no se utiliza el comando MODE, el modo de transmisión por defecto 





6) Tipo de representación (TYPE) 


Con este comando, se especifica cómo se representarán los datos 
de los ficheros que deben transferirse. El proceso que los envía 
debe convertir el contenido de los ficheros en la representación es- 
pecificada, y el proceso que los recibe, debe convertirlos en su re- 
presentación local. Los valores posibles del argumento son los 


siguientes: 


e A: se utiliza la especificación NVT definida en el protocolo Telnet 
(caracteres de 8 bits codificados en ASCII y finales de línea repre- 


sentados con la secuencia <CRLF>). 








° E: se utilizan caracteres de 8 bits codificados en EBCDIC. 





Nota 








En los tipos de representación A y E, un segundo ar- 
gumento opcional permite indicar cómo se especifi- 
ca la información de control para el formato vertical 
del texto (separación entre párrafos, cambios de pá- 
gina, etc.) y puede valer N (no hay información de 
formato), T (hay caracteres de control Telnet: AS- 
CII\EBCDIC) o C (se utiliza el formato del estándar 
ASA, RFC 740). 
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e I: se envía una imagen del fichero consistente en una secuencia 
arbitraria de bits, codificados en bytes (8 bits), que el receptor 
debe almacenar tal como le llega (o añadiendo ceros al final si el 
sistema local necesita que la longitud total sea múltiplo de alguna 
cantidad). 


e L: se envía una secuencia de bytes lógicos de n bits, siendo n el 
valor del segundo argumento (obligatorio en este caso), con to- 
dos los bits consecutivos agrupados en bytes de 8 bits. Según el 
valor de n, es posible que el receptor necesite aplicar alguna 


transformación (reversible) para almacenar los datos. 





E 


Si no se utiliza el comando TYPE, el tipo de representación por de- 


fecto es A (y sin información de formato vertical). 


7) Cambiar de directorio (CWD) 


Normalmente, cada usuario tiene asignado un directorio por defec- 
to en el sistema de ficheros del servidor. Este comando sirve para 
cambiar el directorio de trabajo por el directorio que indica el ar- 


gumento. 

8) Cambiar al directorio padre (CDUP) 

Este comando no recibe ningún argumento. Se trata de un caso par- 
ticular del anterior que el protocolo proporciona para facilitar el ac- 
ceso al directorio padre del actual con independencia de la sintaxis 
utilizada en el sistema de ficheros para referenciarlo. 

9) Montar un sistema de ficheros (SMNT) 

El argumento es un nombre que, en la sintaxis del sistema de ficheros 
del servidor, permite seleccionar un nuevo grupo de ficheros (por ejem- 


plo, otro sistema de ficheros, otra partición del disco, otro disco, etc.). 


10) Mostrar el directorio actual (PWD) 


En la respuesta a este comando (código 257), el servidor informa 


del directorio actual. Para facilitar la interpretación de la respues- 
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Sea cual sea el tipo de re- 
presentación, la transferen- 


cia siempre se realiza en 


bytes de 8 bits. 





Recordad que el puerto de 
datos por defecto del cliente 


es el mismo desde el que ha 
establecido la conexión de 
control. 


Consultad la figura mencio- 
nada en el apartado 18.1.1. 
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ta, el nombre del directorio debe ser la primera palabra que ven- 
ga después del código numérico, y debe ir delimitado por el 


ayn 


cardcter 


11) Puerto de datos (PORT) 


Con este comando, el cliente indica cudl es su puerto de datos, en 
caso de que sea diferente del puerto por defecto. Para efectuar las 
transferencias, el servidor deberá establecer la conexión de datos en 
el puerto especificado. Si ya había una conexión de datos establecida 
con otro puerto cuando se recibe este comando, el servidor deberá 


cerrarla. 


El argumento debe tener esta forma: h1,h2,h3,h4,p1,p2 (cada 
uno de los elementos es un número decimal entre O y 255). Los cua- 
tro primeros números forman la dirección IP, y los dos últimos, el nú- 


mero de puerto (que se representa de más a menos peso). 





Nota 





Cambio de puerto 


Cuando el modo de transmisión requiere cerrar la co- 
nexión después de cada transferencia, se suele utilizar 
este comando para ir variando el número de puerto y 
evitar así las demoras que puede haber cuando se in- 


tenta reutilizar un puerto TCP que se acaba de cerrar. 








El cliente puede especificar una dirección IP diferente de la suya; de 
esta manera, se puede efectuar una transferencia entre dos servido- 
res, como ilustra la figura del modelo FTP, en que un cliente controla 


la transferencia de datos entre dos servidores. 


12) Puerto pasivo (PASV) 


Este comando sirve para indicar al servidor que, cuando se le envíe un 
comando de transferencia, en lugar de establecer de manera activa la 
conexión de datos, debe quedar preparado para recibirla de manera 


pasiva. En la respuesta (código 227), el servidor devuelve la dirección en 


que esperará las peticiones de conexión, y utilizará la misma notación 


del argumento del comando PORT. 


El comando PASV se utiliza en las transferencias entre servidores. 
El cliente debe establecer conexiones de control con los dos servi- 
dores, enviar un comando PASV a uno de los mismos y pasar la 
dirección devuelta al otro con un comando PORT. Entonces debe 
enviar el comando de transferencia correspondiente (leer o alma- 


cenar) al servidor pasivo, y el comando complementario al activo. 
13) Reservar espacio (ALLO) 


Algunos sistemas pueden requerir que se especifique la longitud 
de un fichero antes de almacenarlo. El argumento constituye el 
número de bytes lógicos a reservar. Si es necesario, el primer ar- 
gumento puede ir seguido de la cadena R n, donde n indica la 
longitud máxima de los registros o páginas (para ficheros con tipo 


de estructura R o P). 
14) Obtener (RETR) 
Ésta es la operación de transferencia de ficheros del servidor hacia 
el cliente (o hacia el servidor pasivo). El argumento es el nombre del 


fichero que debe transferirse. 


Tanto en esta operación como en las de almacenar y añadir, si el modo 





de transmisión es B o C, el proceso que envía los datos puede insertar 
un tipo especial de bloque denominado marca de reanudación (su con- 
tenido es un identificador de la posición actual del fichero), que deberá 
utilizarse en caso de error de la transferencia. Cuando encuentra la 
marca, el receptor asocia a la posición actual un identificador propio y 
se lo notifica al usuario. Si quien actúa de receptor es el servidor, activo 
o pasivo, la notificación se lleva a cabo por medio de una respuesta con 
el código 110 y el texto MARK c = s.(c y s son los identificadores 


de la posición del cliente y del servidor, respectivamente). 


15) Almacenar (STOR) 


Esta es la operación de transferencia de ficheros del cliente hacia el 


servidor. El argumento es el nombre del fichero en que el servidor 
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Recordad que cada byte ló- 


gico tiene n bits, donde n es 
el argumento del comando 
TYPE L o, por defecto, 8. 





Como precaución, el cliente 
se debería asegurar que el 


tipo de representación es A 
o E antes de enviar el co- 
mando LIST o NLST. 
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debe almacenar los datos. Si este fichero no existe, se crea; si ya exis- 


te, se descarta su contenido y se sustituye por los datos recibidos. 


16) Almacenar con nombre único (STOU) 


Esta operación es como la anterior, pero sin argumento: el servidor 
elegirá un nombre para el fichero (en el directorio actual) que no co- 
incida con ninguno de los ya existentes. En la respuesta debe notifi- 


carse el nombre elegido. 


17) Añadir (APPE) 


Esta operación también es como la de almacenar, excepto que, si el fi- 


chero ya existe, los datos recibidos se añadirán al final de su contenido. 


18) Listar (LIST) 


El argumento de este comando es opcional. Si no hay argumento, el 
servidor envía por la conexión de datos una lista de los ficheros del 
directorio actual y sus atributos, por lo general en un formato propio 
del sistema. Si hay argumento, la lista se refiere al fichero o grupo de 
ficheros especificado, o a los ficheros contenidos en el directorio es- 


pecificado. 


19) Listar nombres (NLST) 


Este comando es como el anterior, pero con el formato de la lista 
normalizado, lo que significa que consta sólo de los nombres de los 
ficheros, separados por finales de línea, que permite que la lista de- 
vuelta sea procesada, por ejemplo, para que el cliente pueda imple- 


mentar una operación para obtener un grupo de ficheros. 


20) Abortar (ABOR) 


Este comando hace que el servidor interrumpa la transferencia en 
curso (si hay) y, después, cierre la conexión de datos. Si no, simple- 
mente cierra la conexión de datos. En el primer caso, el servidor en- 


vía un código 426 como respuesta al comando de transferencia y, a 





continuación, un código 226 en respuesta al comando ABOR. En el 


segundo caso, sólo envía la respuesta 226. 





Nota 





Para indicar que el servidor debe atender un co- 


mando (ABOR, STAT, QUIT) mientras se esté llevan- 





do a cabo una transferencia, la especificación REC 
959 sugiere que el cliente envíe para la conexión de 
control el código de función IP del protocolo Telnet, 
seguido de una señal synch (es decir, un envío de 
datos urgentes TCP combinado con el código DM), 


y a continuación el comando FTP. 








21) Retomar (REST) 


Si una transferencia ha sido interrumpida por cualquier causa (caída del 
servidor, del cliente, de la red, etc.) es posible retomarla a partir de un 


punto indicado por una marca de reanudación. El cliente debe enviar el 





comando REST con un argumento igual que el identificador de posición 
del servidor correspondiente a la marca deseada e, inmediatamente a 


continuación, el comando de transferencia que desea retomar. 
22) Borrar (DELE) 


El efecto de este comando es borrar el fichero especificado en el ar- 


gumento. 
23) Nombre antiguo (RNER) 


Para cambiar el nombre de un fichero, en primer lugar el cliente 
debe enviar este comando, con el nombre actual en el argumento e, 


inmediatamente, el comando RNTO. 
24) Nombre nuevo (RNTO) 


El argumento de este comando es el nombre nuevo que se debe con- 
ferir al fichero. Sólo se puede utilizar inmediatamente a continuación 


de un comando RNER. 
25) Crear un directorio (MKD) 


El servidor crea el directorio indicado por el argumento. Si la opera- 
ción tiene éxito, el formato del código de respuesta (código 257) es 


idéntico al del comando PWD. 
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Recordad que sólo puede 


haber marcas de reanuda- 
ción en los modos de trans- 
misión Bo C. 





La IANA (Internet Assigned 
Numbers Authority) es la 
encargada de publicar la 
lista de nUmeros asignados. 
En el momento de elaborar 


esta unidad, la Ultima ver- 
sion de la lista se puede en- 
contrar en la especificación 
RFC 1700. 


ftp://ftp.isi.edu/in-notes/ 
iana/assignments/ 
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Nota 





Según la especificación RFC 959, el nombre retornado 


en la respuesta 257 debe ser apto para poderlo utili- 





zar como argumento del comando CWD (cambiar di- 
rectorio). Como en algunos sistemas (obsoletos) este 
argumento no podía ser un nombre relativo al direc- 
torio actual, sino que debía ser un nombre absoluto (y 
el del comando MKD, en cambio, sí que podía ser re- 


lativo), por norma general los servidores responden al 





comando MKD con el nombre completo del directorio 


creado. 








26) Borrar un directorio (RMD) 


El servidor borra el directorio indicado por el argumento. 


27) Estatus (STAT) 


Si se envía este comando durante una transferencia, el servidor incluye 
en la respuesta información sobre el estado actual de la transferencia. 
Si no, se le puede pasar un nombre de fichero como argumento para 
que el servidor envíe información similar a la del comando LIST, pero 
por la conexión de control, o bien se puede utilizar sin argumento para 


obtener información general sobre el proceso FTP. 


28) Sistema (SYST) 


El servidor envia una respuesta informando sobre qué tipo de siste- 
ma es. La primera palabra del texto debe ser uno de los nombres de 


sistema normalizados de la lista oficial de números asignados. 





Ejemplo 


Un cliente Unix puede utilizar este comando para saber 


si el servidor también es Unix y, si lo es, invocar auto- 





máticamente el comando TYPE 1 para mejorar la efi- 


ciencia de las transmisiones. 


29) Servicios adicionales (SITE) 


Si el servidor ofrece servicios adicionales además de las operaciones es- 


tándar del protocolo, el cliente puede invocarlos por medio de los argu- 





mentos del comando SITE, cuya sintaxis depende del mismo servidor. 


30) Ayuda (HELP) 


Este comando, mediante el cual el servidor envía información general 
sobre la implementación del protocolo (por ejemplo, qué comandos so- 
porta y cuáles no), se puede utilizar sin argumentos. No obstante, el ser- 
vidor también puede proporcionar información más específica si se le 


pasan argumentos (por ejemplo, un nombre de comando). 


31) Operación nula (NOOP) 


El servidor simplemente envía una respuesta 200. 


32) Reinicializar (REIN) 


El servidor reinicializa la sesión olvidando la identidad del usuario y 
volviendo a dar a los parámetros de transmisión los valores por de- 
fecto. La sesión queda en el mismo estado en que se encontraba jus- 


to después de establecer la conexión de control. 


33) Acabar la sesión (QUIT) 


El servidor da la sesión por finalizada y cierra la conexión de control 
(si hay una transferencia en curso, después de enviar la respuesta co- 


rrespondiente). 


La tabla siguiente resume la sintaxis de los comandos y los posibles 


códigos de respuesta a cada uno de los mismos según la especifica- 
ción RFC 959: 





Tabla 9. 








Sintaxis de los comandos y códigos de respuesta 


Comando Respuesta 





Eee ee ee 220, 120, 421 
conexion 











USER usuario 230, 331, 332, 530 
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Sintaxis de los comandos y códigos de respuesta 



























































































































































Comando Respuesta 
contraseña 230, 202, 332, 530 
cuenta 230, 202, 530 
F|R|P 200, 504 
DE S|B|C 200, 504 
o 200, 504 
CWD directorio 250, 550 
CDUP 250, 550 
SMNT sist-ficheros 250, 202, 550 
PWD 257, 550 
Ae ee 290 
PASV 227 
¡ ree e 200, 202, 504 
ETR fichero 226,250, 110, 125, 150, 550 
226, 250, 110, 125, 150, 452, 532, 552, 
553 
226, 250, 110, 125, 150, 452, 532, 552, 
553 
i Hehe 226, 250, 110, 125, 150, 452, 532, 550, 
552, 553 
[ [nombre] 226, 250, 125, 150 
[ [nombre] 226, 250, 125, 150 
226 
[ marca 350 
fichero 250, 550 
R fichero 350, 450, 550 
RNTO fichero 250, 503, 532, 553 
KD directorio 257,550 
RMD directorio 250, 550 
T [nombre] 211,212,213 
SYST 215 
SITE cadena... 200, 202 
HELP [cadena] 211,214 
NOOP 200 
REIN 220, 120, 421 
QUIT 221 








Además de los códigos de respuesta específicos contenidos en esta 
tabla, el cliente también puede recibir códigos de respuesta genera- 
les a cada comando, como 500, 501, 502, 530 y 421, o bien, en el 


caso de los comandos de transferencia, 425, 426 y 450. básicos; es decir, los que no 
pertenecen al grupo de la 
“implementación mínima” 


La respuesta 502 sólo es vá- 


lida para los comandos no 





18.1.4. Implementaciones del FTP 


A la hora de implementar el protocolo FTP, debemos distinguir ser- 


vidor de cliente: 


1) Servidores FTP 


Según la especificación RFC 959, la implementación mínima de un 


servidor FTP debe soportar los comandos siguientes: 


+. USER 





e TYPE AN 
+ NOOP 

+ STOR 

e MODE S 

¢ QUIT 

+ PORT 

= STRU F 

e STRU R 





Nota 





Muchos servidores soportan el acceso público (posible- 
mente restringido) a una parte de su sistema de ficheros 
sin necesidad de seguir el procedimiento normal de au- 


tenticación. 


Este tipo de servicio se conoce como FTP anónimo. Por 
norma general, se accede al mismo utilizando el nom- 
bre de usuario anonymous como argumento del co- 
mando USER. Si el servidor pide una contraseña, 
suele aceptar cualquier cadena. En este caso, es cos- 
tumbre proporcionar la dirección de correo electróni- 


co del usuario como contraseña. 
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2) Clientes FTP 


En la actualidad, existen muchas implementaciones de clientes FTP 
para una gran variedad de sistemas diferentes (incluyendo los nave- 
gadores WWW); sin embargo, el cliente más utilizado durante mu- 
cho tiempo ha sido la utilidad del sistema operativo Unix y de las 


distribuciones GNU/Linux denominada precisamente ftp. 


Este cliente presenta al usuario la mayoría de las respuestas del ser- 
vidor, incluyendo los códigos numéricos. Los principales comandos 


que ofrece son los siguientes: 


* open: permite especificar el nombre del servidor al que es preciso 


conectarse, si no se ha pasado como argumento del programa, y 
Recordad que los nombres . on . : 
entonces pide automáticamente el nombre de usuario y, si proce- 


de los comandos se pueden 


abreviar siempre que no ge- de, la contraseña. 
neren ambigüedades. 











e cd, pwd, dir: envían los comandos CWD, PWD y LIST al servidor. 








e ascii, binary: envían los comandos TYPE A y TYPE I al servidor. 





e get: efectúa la secuencia PORT-RETR para copiar un fichero del 


servidor. 


e put: efectúa la secuencia PORT-STOR para copiar un fichero en 


el servidor. 


e ^C (o el carácter que genere la señal de interrupción): envía el co- 


mando ABOR. 














e delete, mkdir, rmdir: envían los comandos DELE, MKD y 





RMD. 


* rename: envia la secuencia RNFR-RNTO necesaria para cambiar 


el nombre de un fichero. 


* mget: envía el comando NLST para saber qué ficheros concuer- 





dan con un patrón, y después una serie de comandos RETR para 


poderlos copiar. 
* mput: envía una serie de comandos STOR. 


* mdelete: envía el comando NLST y, a continuación, una serie de 











comandos DELE. 
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e quote: permite enviar un comando directamente al servidor (por 


ejemplo, quote syst). 
e ?: muestra un mensaje de ayuda. 


e quit o bye: envía el comando QUIT y cierra el programa. 


18.1.5. Ejemplo de sesión FTP 


A continuación, mostramos los mensajes intercambiados entre un 
cliente y un servidor en una hipotética sesión de transferencia por 
medio de la utilidad ftp. 


Después de cada comando de usuario, se muestran los mensajes en- 
viados, y se indica su origen y el destino (C para el cliente, S para el 


servidor), y el número de puerto: 


open ftp.uoc.es 
014695 => 5121 (establecimiento de conexión) 
S121 => C4695 220 tibet FTP server (5.6) ready.<CRLF> 
(usuari) anonymous 
C:4695 > S:21 USER anonymous<CRLF> 
S:21 > C:4695 331 Guest login ok, send ident 
as password.<CRLF> 
(contraseña) usuarifacme.com 
C:4695 => S:21 PASS usuari@acme.com<CRLF> 


Ss:21 > C:4695 230 Guest login ok, access restrictions 


apply .<CRLF> 


cd pub 
C:4695 > S:21 CWD pub<CRLF> 
S:21 > C:4695 250 CWD command successful.<CRLF> 
dir 
C:4695 > S:21 PORT 193,146,196,254,18,88<CRLF> 
S:21 > C:4695 200 PORT command successful.<CRLF> 
C:4695 > S:21 LIST<CRLF> 
S:20 > C:4696 (establecimiento de conexión) 
S:21 > C:4695 150 ASCII data connection for /bin/ls 
(193.146.196.254,4696) (0 bytes) .<CRLF> 
S:20 > C:4696 total 20<CRLF> 
drwxr-xr-x 7 0 other 512 Aug 3 07:10 
. <CRLF> 
S:20 > C:4696 (cierre de conexión) 


S:21 => ©4695 226 ASCII Transfer complete.<CRLF> 
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cd doc 
C:4695 > S:21 
4695 


S:21 => E 


dir 


C:4695 > 


:21 > C: 


S 
C:4695 > 
S 


220 => Ex 


5:21 > €: 


S:20 > C: 


S:20 > C: 


S:21 > C:4 
get README 


S221 
4695 
S221 
4697 


4695 


4697 


4 


697 
695 


C:4695 > S:21 


S:21 > C: 


:4695 > 


E 
s:20 
s:21 


s:20 


s:20 
5:21 


bye 


C:4695 > 
$:21 5 C: 
$:21 > C: 
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> 
> 


ES 
C: 


C:4 


C:4 


4 


4 


4 





695 


$221 


699 
695 


699 


699 
695 


s:21 
4695 
4695 


CWD doc<CRLF> 
250 CWD command successful.<CRLF> 


PORT 193,146,196,254,18,89<CRLF> 
200 PORT command successful.<CRLF> 
LIST<CRLF> 


(establecimiento de conexión) 


150 ASCII data connection for /bin/ls 
(193.146.196.254,4697) (0 bytes) .<CRLF> 


total 886<CRLF> 
drwxr-xr-x 2 0 other 512 Oct 24 1996 .<CRLF> 


(cierre de conexién) 
226 ASCII Transfer complete.<CRLF> 


PORT 193,146,196, 254,18, 91<CRLF> 

200 PORT command successful.<CRLF> 
RETR README<CRLF> 

(establecimiento de conexién) 

150 ASCII data connection for README 
(193.146.196.254,4699) (95 bytes) .<CRLF> 


(contenido del fichero) 


(cierre de conexién) 
226 ASCII Transfer complete.<CRLF> 


QUIT<CRLF> 
221 Goodbye.<CRLF> 


(cierre de conexión) 


Hay situaciones en las que se necesita transferir ficheros de un orde- 


nador a otro y el FTP no es apropiado, principalmente a causa de su 


complejidad. 





Nota 











Un ejemplo típico en el que se observa la necesidad 


de transferir ficheros de un ordenador a otro es el de 


las estaciones de trabajo sin disco, que cargan el sis- 


tema operativo por medio de la red. En este caso, 


debe haber un ordenador que funcione como “servi- 


dor de arranque” de la estación, proporcionándole el 


fichero o ficheros en que se encuentra el código ejecu- 


table del sistema operativo. 








Un pequeño programa residente en la memoria ROM 
de la estación debe controlar la transferencia de los fi- 


cheros. 


Para esta operación el FTP no es adecuado, puesto 
que requiere una implementación del protocolo de 


transporte TCP, establecer en el mismo diferentes co- 


nexiones simultáneas, etc. 











18.2.1. Conceptos básicos del TFTP 


Como el TFTP se basa en datagramas, generalmente se utiliza con el 
protocolo de transporte UDP. El número de puerto al que el cliente 


debe enviar las peticiones de servicio es el 69. 


Una transferencia TFTP se inicia con un datagrama enviado por el 
cliente en el que se solicita la operación deseada: leer o escribir un 
fichero. A partir de entonces, se establece un diálogo en el que cada 
parte envía un datagrama de manera alternada. Cada uno de estos 
datagramas sirve de confirmación de recepción del anterior. Ello signi- 
fica que en cada momento sólo puede haber un datagrama pen- 


diente de ser confirmado. 


De este modo, la recuperación de los errores de transmisión es muy 
simple: si pasa un tiempo sin que llegue la respuesta a un datagra- 
ma, se reenvia y si se recibe un datagrama que ya se había recibido 
con anterioridad, se ignora. Por tanto, basta con guardar el último 


datagrama enviado por si debe retransmitirse. 
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Lectura complementaria 





Si queréis más información 
sobre el TFTP, consultad la 
obra siguiente: 


K. Sollins (1992, julio). RFC 
1350 - The TFTP protocol. 





Habrá un último bloque de 
cero bytes sólo cuando la 


longitud del fichero que 
deba transmitirse sea múlti- 
plo de 512. 
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El cliente debe enviar su primer datagrama desde un puerto C al 
puerto 69 del servidor. Cuando lo recibe, el servidor elige un número 
de puerto S que debería ir cambiando en cada transferencia. Todos 
los datagramas que envíe el servidor tendrán como puerto de origen 
el número S y como puerto de destino el número C; todos los da- 
tagramas que envíe el cliente, excepto el primero, tendrán como 
puerto de origen el número C y como puerto de destino el número S. 
Ello permite detectar una posible duplicación del primer datagrama: 
si el servidor lo recibe dos veces o más, debe enviar ambas respues- 
tas desde puertos diferentes; el cliente aceptará la primera y enviará 


mensajes de error a los puertos de los que provengan las otras. 


En el transcurso de la transferencia, una de las partes envía los datos del 
fichero y la otra sólo envía confirmaciones. Los datos se envían en blo- 
ques de longitud fija, 512 bytes, excepto el último bloque, que tendrá 


entre O y 511 bytes. Cada bloque se envía en un datagrama. 


La transferencia se acaba cuando el receptor recibe el último bloque de 
datos y envía la confirmación correspondiente. En este momento, puede 
dar por finalizada la comunicación. Opcionalmente, puede esperar por 
si vuelve a recibir el último bloque, lo que significaría que la última con- 
firmación no ha llegado al emisor. Si sucede esto, sólo es preciso reen- 


viar esta confirmación. 


Por su parte, el emisor dará por acabada la transferencia cuando reciba 
la última confirmación o cuando haya transcurrido cierto tiempo re- 
transmitiendo el último bloque de datos y no reciba respuesta. En este 
último caso, podría ser que la transferencia se hubiera efectuado correc- 
tamente y que el Único problema estuviera en la transmisión de la última 


confirmación. 


18.2.2. Funcionalidad del TFTP 


El TFTP ofrece dos operaciones básicas: leer ficheros del servidor y 
escribir ficheros en el servidor. El datagrama inicial indica la opera- 


ción que el cliente quiere llevar a cabo y tiene el formato siguiente: 





Figura 81. 











El código de operación es un número de dos bytes, que puede ser 
RRO O WRO si el cliente solicita leer o escribir un fichero, respectiva- 
mente. A continuación, existen dos cadenas de caracteres, acabadas 
con un byte igual a cero: la primera es el nombre del fichero y la se- 
gunda es el modo de transferencia (el equivalente del tipo de repre- 
sentación en FTP). Esta segunda cadena puede ser netascii u 
octet (en caracteres ASCII, y en cualquier combinación de mayús- 
culas y minúsculas). El primer valor indica que los datos son carac- 
teres ASCII tal como se usan en el protocolo Telnet, y el segundo 


indica que los datos son bytes arbitrarios de 8 bits. 





Nota 





En versiones anteriores del protocolo, había un tercer 
modo de transferencia llamado mai 1, sólo aplicable a 
las operaciones de escritura, en el que el nombre del 
fichero era sustituido por el nombre de un usuario que 


debía recibir los datos por correo. 


Los datagramas que contienen los datos y las confirmaciones de re- 


cepción tienen los formatos siguientes: 





Figura 82. 











ol 


Formato del de 





El primer campo es el código de operación y el segundo es el número 
de bloque que se envía o se confirma (ambos campos son de dos bytes). 
Cada bloque del fichero tiene un número correlativo, empezando 


por 1, que sirve para distinguir las confirmaciones duplicadas. 


Si el cliente envía un datagrama inicial RRO, el servidor contesta con 





un datagrama DATA con número de bloque igual a 1 y, si el cliente 
envía un datagrama inicial WRO, el servidor contesta con un datagra- 


ma ACK con número de bloque igual a O y, a continuación, el cliente 
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Si llega un datagrama del 
servidor con un número de 
puerto de origen incorrecto 
(probablemente a causa de 


un datagrama inicial dupli- 
cado), la transferencia con 
este puerto queda interrum- 
pida, pero la que utiliza el 
puerto correcto debe conti- 
nuar con normalidad. 
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envia el primer datagrama de datos. Entonces, cliente y servidor se 
intercambian datagramas ACK y DATA de manera alternada, con las 
retransmisiones necesarias si no llega el datagrama que correspon- 


de en cada momento. 


El TFTP también prevé la terminación de la transferencia si se produ- 
ce algún error. Cuando se detecta el error, se envía un datagrama 


con el formato siguiente: 





Figura 83. 








Los dos primeros campos son el código de operación y el código de 
error (cada uno de dos bytes). A continuación, hay una cadena de ca- 
racteres, acabada en O, que puede servir para describir a un usuario 


humano la causa del error. 


Un datagrama de error indica que se da por acabada la transferen- 
cia y no debe confirmarse ni, por tanto, retransmitirse. Ahora bien, si 
por alguna razón se pierde este datagrama, la otra parte interpreta- 
rá que la transferencia ha acabado prematuramente cuando haya 


transcurrido cierto tiempo retransmitiendo sin recibir nada. 


En las tablas siguientes se presenta una relación de los códigos nu- 


méricos asignados a cada operación y a cada tipo de error TFTP: 





Tablas 10 y 11. 








Operación 


Error indefinido (veáse el mensaje) 








No se ha encontrado el fichero 








Acceso denegado 








Disco lleno 








Operación no válida 








Número de puerto incorrecto 





Ya existe el fichero 





Usuario incorrecto (en modo mai 1) 








18.2.3. Implementaciones del TFTP 


En muchos sistemas Unix y distribuciones GNU/Linux hay un servidor 
del TFTP llamado tftpd. Como no existe ningún tipo de identifica- 
ción de usuario, los clientes pueden acceder en principio a cualquier 
fichero con permisos de acceso público. En algunos sistemas, sin em- 
bargo, puede restringirse el acceso a un directorio o unos directorios 
determinados. No obstante, el servicio TFTP suele estar inhabilitado, 
y sólo lo ofrecen los sistemas en que se necesita por algún motivo 
concreto (por ejemplo, los servidores de arranque de las estaciones 


sin disco). 


Asimismo, hay un programa cliente llamado tftp que funciona de 
manera similar a la utilidad £tp: admite comandos como get, put, 
ascii, binary o quit (pero no cd, dir, delete, rename, etc., 


porque el protocolo no los soporta). 
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Por norma general hay un 
directorio llamado /tftp- 
boot en el que se guardan 


las imágenes de los siste- 
mas operativos de los clien- 
tes sin disco, y sólo se 
permite a este directorio el 
acceso por medio del TFTP. 





| 19. Correo electrónico Internet 





Al especificar esta aplicación, se consideró adecuado que todas sus 


características siguieran las ideas básicas del correo postal: 


Las operaciones permiten básicamente enviar mensajes y recibirlos. 


Los elementos son equivalentes a los mensajes, los usuarios, las 


oficinas de correo y los buzones. 


La funcionalidad está basada en la filosofía del almacenamiento y 
el reenvío: cuando un mensaje llega a una oficina de correos, esta 
última lo almacena y no lo reenvía hasta el momento en que lo con- 
sidera oportuno. De este modo, los mensajes van de oficina de co- 


rreos en oficina de correos hasta que llegan al destinatario. 


Para llevar a cabo esta funcionalidad, se definieron los protocolos si- 


guientes: 


SMTP (simple mail transfer protocol), para la transferencia de 


mensajes. 


POP3 (post office protocol), para el acceso simple a buzones de 


correo. 


IMAP4rev1 (Internet message access protocol), para el acceso 


complejo a buzones de correo. 


También fue necesario definir un formato de mensaje, el RFC 822, 


que con posterioridad se amplió y dio lugar al formato MIME. 
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La filosofia del almacena- 
miento y el reenvio permite 
superar problemas como 
las caidas de la red; en este 
caso, los mensajes no se 
pierden, puesto que en 
cada momento hay una ofi- 


cina responsable del men- 
saje. 





Lectura complementaria 


Si deseáis más información 
sobre el formato de los 
mensajes de correo Internet, 
el RFC 822, consultad la 
obra siguiente: 

D. Crocker (1982, 13 de 
agosto). RFC 822 - Standard 
for the format of ARPA Internet 
text messages. 





Consultad en el anexo 3 la 


notación que se utiliza para 
describir los campos de los 
mensajes. 
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| 19.1. Formato de los mensajes: el RFC 822 


Antes de describir los diferentes protocolos relacionados con el co- 
rreo electrónico, es preciso ver cuál es el formato o la norma de los 
mensajes que se utiliza en el mismo. Este formato recibe el nombre 
del estándar en que se especifica, RFC 822, y se basa en los elemen- 
tos típicos de las cartas postales; es decir, el sobre, que contiene la 
información del destinatario y del remitente de la carta, el contenido, 


que es el mensaje en sí. 


El estándar especifica que los mensajes de correo electrónico están 


formados por las dos partes siguientes: 


e La cabecera, que recoge la información general del mensaje. 
Equivale al sobre de la carta postal y está formada por una serie 
de campos de cabecera, cada uno de los cuales incluye un tipo 


concreto de información. 


e El cuerpo del mensaje, que contiene el mensaje en sí. Corres- 


ponde al contenido de la carta postal. Esta parte es opcional. 


Cada campo de cabecera consta de un nombre del campo (que 


un 


identifica el tipo de información) seguido por el carácter “:”, opcio- 
nalmente acompañado por un cuerpo del campo (que incluye la in- 
formación del campo), y acaba con un carácter <CRLF>. El formato 


de los campos es el siguiente: 


NombredelCampo: [CuerpodelCampo] <CRLF> 


Por norma general, cada campo de cabecera se representa en una 
sola linea, empezando desde el primer cardcter de la misma. En el 
caso de que se necesite mds de una, es preciso codificar estas lineas 
adicionales empezando por un cardcter, o mds, de espacio o tabu- 


lador. 


El cuerpo del mensaje es simplemente una secuencia de lineas con 
caracteres ASCII. El cuerpo está separado de la cabecera por una lí- 


nea nula (es decir, por la secuencia <CRLF><CRLF>). 


Algunos sistemas de correo electrénico permiten reenviar mensajes a 
los usuarios. Por este motivo, se incluyen en el mismo unos campos de 
cabecera con información sobre el reenvío. Estos campos son los que 
llevan el prefijo Resent- y tienen la misma semántica que los cam- 
pos correspondientes que no lo llevan. No obstante, siempre conven- 
drá tener presente que, dentro de un mensaje, los campos que llevan 


prefijo son los más recientes. 


19.1.1. Información de la cabecera 


Los campos de cabecera del mensaje deben proporcionar informa- 


ción general del mensaje, incluyendo la información equivalente a 


Consultad el formato de las 


la de un sobre postal; de este modo, encontramos los campos si- direcciones para identificar 


guientes: los buzones de usuario en el 
apartado 19.2.2. 





1) Originador (From/Resent-From) 


La identidad y la dirección del buzón de la persona o las perso- 
nas que originan el mensaje se puede incluir en el campo From 
o Resent-From. En este campo, se puede introducir la dirección 


del buzón de un originador o más. 


From: l*dirección 
Resent-From: lfdirección 


2) Destinatario (To/Resent-To) 


El RFC 822 identifica al destinatario o destinatarios principales del 
mensaje por medio del campo To o Resent-To. En este campo, se 


puede introducir la dirección de un destinatario o más. 


To: lfdirección 
Resent-To: lfdirección 


3) Destinatario de copia (Cc/Resent-cc) 


Asimismo, existe la posibilidad de enviar copias de un mensaje. En este 


caso, la identidad del receptor o receptores secundarios del mensaje 
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se especifica con el campo Cc o Resent-cc. En este último, se puede 


introducir la dirección de un destinatario de copia o más. 





4) Destinatario adicional (o de copia ciega) (Bcc/Resent-bcc) 


Cuando se desea enviar una copia del mensaje a destinatarios adi- 
cionales, sin que ninguno de ellos (los principales, los de copia y los 


de copia ciega) sepan que otros destinatarios la han recibido, se utiliza 





el campo Bcc 0 Resent-bcc que no lo ve ninguno de ellos. 





5) Destinatario de respuesta (Reply-To/Resent-Reply-To) 


La identificación del destinatario o destinatarios a los que deben 
enviarse las respuestas se puede llevar a cabo por medio del 
campo Reply-To 0 Resent-Reply-To; en este último se pue- 
de introducir la dirección de un destinatario de la respuesta o 


L 


mas. 





6) Asunto (Subject) 


Otra posibilidad que ofrece el RFC 822 es enviar un texto explicativo 


del asunto del mensaje con el campo Subject. 
7) Data (Date/Resent-Date) 


Dentro de un mensaje también puede incluirse la hora y la fecha en 


que se envía por medio del campo Date o Resent-Date. El primer 


sistema de correo que recibe el mensaje genera automáticamente 


este campo. 


Date: fech 
Resent-Dat 


ora 
fecha-hora 






8) Sistema remitente (Sender/Resent-Sender) 


Algunas veces el usuario que envia el mensaje no es el mismo que el 
autor. En estos casos, la identidad del agente (persona, sistema o 
proceso) que envia en realidad el mensaje se identifica con el campo 


Sender O Resent-Sender. 


Sender: buzón 
Resent-Sender: buzón 


9) Camino de retorno hacia el originador (Return-path) 


El mensaje puede incluir la identificación del camino de retorno ha- 
cia el originador del mensaje con el campo Return-path. Este 
campo lo añade el sistema de transporte final que entrega el men- 


saje al receptor. 


| Return-path: addr-ruta | 


10) Información de sistemas intermedios (Received) 


Existe la posibilidad de que cada sistema de transporte intermedio 
por el cual pasa el mensaje incluya información de los sistemas emi- 
sor (from) y receptor (by), del mecanismo físico (via), del identifica- 
dor del mensaje (id), de las especificaciones originales (for) y de la 
hora de recepción por medio del campo Received. Cada sistema 


intermedio añade una copia de este campo al mensaje. 


Received: 
[from dominio] 
[by dominio] 
[via atom] 
*(with atom) 


[id id-msgl 


[for addr-spec] 
; fecha-hora 
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11) Identificador del mensaje (Message-ID/Resent-Message-ID) 


Cada mensaje debe incluir un identificador único del mensaje, para que 
pueda ser contestado o referenciado con posterioridad, en el campo 
Message-ID o Resent-Message-ID. El sistema que genera el iden- 


tificador es el encargado de asegurar que el identificador sea Unico. 


Message-ID: id-msg 
Resent-Message-ID: id-msg 


12) Identificador del mensaje contestado (In-Reply-To) 


Cuando un mensaje constituye la respuesta de un mensaje anterior, 
el mensaje original se puede referenciar por medio de su identifica- 


dor dentro del campo In-Reply-To. 


In-Reply-To: 
*(frase | id-msg 


13) Identificador de mensajes referenciados (References) 


Si se desea enviar un mensaje que se refiere a otros mensajes, el 
identificador del mensaje referenciado se puede incluir dentro del 


campo References. 


References: 
*(frase | id-msg) 


14) Palabras clave (Keywords) 


Las palabras clave o frases referentes al mensaje se pueden incluir, 


separadas por comas, dentro del campo Keywords. 


Keywords: #frase 


15) Comentarios (Comments) 


Se puede incluir un texto de comentario en el mensaje, sin interferir 


su contenido, por medio del campo Comments. 


Comments: texto 


16) Identificación del mecanismo de cifrado (Encrypted) 


El RFC 822 permite cifrar el cuerpo del mensaje. En este caso, es con- 
veniente enviar una o dos palabras que identifiquen el mecanismo 


de cifrado que se ha aplicado utilizando el campo Encrypted. 


Encrypted: 1#2palabras 





Nota 





El RFC 822 sólo define la sintaxis para especificar un 
mecanismo de cifrado; sin embargo, no especifica el 


mecanismo ni la manera de utilizarlo. 


17) Campos de uso personal. 


El estándar permite también que los usuarios definan campos para 
uso personal. El nombre de los campos creados por un usuario debe 


empezar obligatoriamente por la cadena X-. 


X-campo-uso-personal 


18) Campos de extensión 


En el futuro se pueden estandarizar nuevos campos de cabecera. 


Para que no haya conflictos con los campos de uso personal, el nom- 


bre de los campos nunca empezará por la cadena X-. 


campo-extension 
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19.1.2. Ejemplo 


En este apartado se presenta un ejemplo de mensaje RFC 822 en el 
que se pueden apreciar los campos de cabecera más típicos, así 
como un cuerpo breve del mensaje. Conviene recordar que es un 
mensaje en ASCII de 7 bits. 


Date: 25 Jun 2003 0932 PDT 
From: Jordi Inyigo <jinyigo@uoc.edu> 
Subject: Ejemplo mensaje RFC 822 
Sender: jmmarques@uoc.edu 
Reply-To: jinyigo@uoc.edu 
To: Ramon Marti <rmarti@uoc.edu>, 
xperramon@uoc.edu 
Cc: Llorenc Cerda <lcerda@uoc.edu>, 
Jose Barcelo <jbarcelo@uoc.edu>, 
epeig@uoc.edu 
Comment: os envío esta información que os puede interesar 
In-Reply-To: <1234321.567898765@uoc.edu> 
Received: from uoc.edu by peru.uoc.es 
(8.8.5/8.8.5) with ESMTP id SAA14826 
for <rmarti@uoc.edu >; Fri, 20 Jun 2003 
18:35:52 +0200 (MET DST) 
Received: from rectorat.uoc.edu(147.83.35.35) 
by uoc.es via smap (V2.0) id xma020193; 
Mon, 20 Jun 2003 18:38:50 +0200 for 
rmarti@uoc.edu 
Message-Id: <199809211639.SAA20364@uoc.edu> 


Este mensaje tiene formato RFC 822 e incluye 
algunos de los campos de cabecera mas utilizados. 





Actividad 


Coged un mensaje de correo electrónico que hayáis re- 
cibido y analizad toda la cabecera. Identificad todos los 
campos y tratad de averiguar quién es el responsable 


de crear cada uno de los campos. 


| 19.2. El SMTP 


El SMTP es el protocolo más utilizado en Internet para transferir men- 


Lectura complementaria 


= - - - sajes de correo electrónico. Proporciona la funcionalidad necesaria 
Si queréis más información . Poa “a f 

Abre ele consultada para conseguir una transferencia fiable y eficiente de mensajes de co- 
obra siguiente: rreo entre ordenadores que actúan como oficina de correos. Siguien- 
J. Postel (1982, 1 de agos- 


to). RFC 821 - Simple Mail 
Transfer Protocol. y el reenvío. Es decir, cuando un mensaje llega a una oficina, queda 


do las ideas del correo postal, el SMTP se basa en el almacenamiento 





almacenado en la misma cierto tiempo antes de ser entregado a otra 
oficina o al destinatario final. Conviene señalar, asimismo, que cada 
usuario debe disponer de un buzón para recibir mensajes, el cual 


siempre debe estar asociado a una oficina determinada. 
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19.2.1. Modelo del SMTP 


Desde el punto de vista del modelo, el SMTP debe proporcionar los 
elementos necesarios para la transferencia de mensajes. Por ello, se 


definen los elementos siguientes: 


e Agente de usuario: se encarga de introducir los mensajes en el 


sistema de correo SMTP. 
El agente de usuario, defini- 


do en la mayoria de los es- 


tándares, es equivalente al 
mensajes a receptores SMTP a partir de peticiones de los usuarios. elemento usuario especifi- 


Generalmente, cada emisor SMTP tiene asociada una cola de lia RIOS 
servidor. Puede ser tanto 


+ Emisor SMTP: se ocupa de realizar las conexiones y de enviar 


mensajes, en la que se almacenan los mensajes antes de ser re- 


otra aplicacién, como una 


enviados (siguiendo la filosofia del almacenamiento y el reenvio). persona por medio de una 
interfaz de usuario. 





e Receptor SMTP: se encarga de recibir los mensajes. Si el mensaje 
va destinado a un usuario asociado al mismo sistema en que se 
encuentra el receptor SMTP, éste deposita el mensaje en el buzón 
del destinatario. En caso contrario, el receptor SMTP deposita el 
mensaje en la cola de mensajes del emisor SMTP asociado, que 
lo recupera y lo reenvía hacia el receptor SMTP de otra oficina 


más próxima al destinatario. 


Conviene destacar que los sistemas que actúan como oficina deben 
disponer al mismo tiempo de un receptor SMTP (para recibir los men- 
sajes), de buzones de los usuarios y de un emisor SMTP (para poder 


reenviar los mensajes) con una cola de mensajes. 


La figura siguiente nos muestra el modelo de un sistema SMTP: 





Figura 84. 
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El nombre de dominio suele 
estar formado por la se- 


cuencia de nombres de los 
subdominios de los que de- 
pende jerárquicamente se- 


A 


parados por el cardcter ”. 





Cada ordenador que actúa 
como oficina de correos 
suele definir un dominio de 
correo, que se identifica con 
un nombre de dominio. Este 
nombre es el que se encuen- 
tra en la parte dominio de 
la dirección electrónica de 


los usuarios que tienen los 


buzones en estas máquinas. 
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Nota 





Notad que este modelo, así como los otros que se es- 
tudiarán en este módulo, sigue el modelo cliente/ser- 
vidor definido con anterioridad. Asimismo, conviene 
remarcar que cada estándar proporciona un nombre 
diferente a los elementos del modelo cliente/servidor. 
En el estándard que nos ocupa, el usuario equivale al 
agente de usuario, el cliente equivale al emisor SMTP 


y el servidor equivale al receptor SMTP. 








19.2.2. Direcciones de correo 


Para que el sistema de correo sea capaz de entregar un mensaje, se 
precisa algún mecanismo que permita definir direcciones para los 
buzones de los usuarios. En los protocolos Internet, la dirección de 
buzón está formada por una cadena que identifica a un usuario 
(persona, sistema o proceso) y una cadena que identifica el sistema 


(dominio) en que se encuentra el buzón. 


direccion = usuario@dominio 


dominio = subdominio*(.subdominio) 


Con este tipo de direccionamiento electrónico, se tiene la funcionali- 


dad siguiente: 


+ El mensaje se envía al sistema identificado por el nombre de do- 
minio que se encuentra en la dirección a la derecha del signo @ 


(es decir, dominio). 


e Una vez en el sistema, el mensaje se entrega al buzón del usuario 
identificado en la dirección a la izquierda del signo @ (es decir, 


usuario). 


+ El SMTP proporciona también la posibilidad de definir listas de 
correo, que constituyen listas de destinatarios identificadas por 
una Única dirección. Esta última es la que se utiliza para enviar 
mensajes a la lista, y el sistema SMTP se encarga de expandirla y 


enviar el mensaje a todos los usuarios que sean miembros de la 


misma en aquel momento. Este método permite la modificacién 


de la lista sin necesidad de cambiar la dirección. 


19.2.3. Envío de correo y mensajes a terminales 


Además del envío de mensajes de correo a buzones (en el estándar, 
mail), que es su propósito principal, el SMTP también soporta la en- 
trega de mensajes al terminal del destinatario (en el estándar, sena). 
Como la implementación de estos dos métodos es muy similar, el 


SMTP define comandos en que combina. 


19.2.4. Conceptos básicos del SMTP 


El SMTP está basado en conexiones TCP y el puerto que tiene asig- 


nado es el 25. 


Como hemos comentado al describir el modelo, el emisor SMTP 
hace llegar mensajes de correo al receptor. Para conseguirlo, se es- 
tablece un diálogo entre los dos con comandos que envía al emisor 


y respuestas con las que contesta el receptor. 


Tanto los comandos como las respuestas SMTP siguen las reglas es- 
pecíficas del protocolo Telnet. Es decir, constituyen cadenas de ca- 
racteres codificados con bytes según el código ASCII y se utiliza la 


secuencia <CRLF> para representar el final de línea. 


e Los comandos SMTP están formados por un código constituido 
por cuatro caracteres alfanuméricos y, según los comandos, un 


espacio y una serie de parámetros. 


e Las respuestas SMTP están formadas por un código numérico de tres 


dígitos que, habitualmente, va seguido de un texto descriptivo. 


En los apartados siguientes se describirán los comandos definidos y 


las posibles respuestas. 


19.2.5. Funcionalidad del SMTP 


Es preciso diferenciar entre funcionalidad básica y funcionalidad adi- 


cional. 
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Funcionalidad básica 


Una vez conectado, el emisor SMTP se identifica ante el receptor 


SMTP con el comando HELO. 


HELO dominio 


Cuando se quiere iniciar el envío de un mensaje de correo, se utiliza 





el comando MAIL, que incluye la identificación del sistema desde el 
que se envía el mensaje. Este comando da lugar al campo FROM: 


del mensaje. 


MAIL FROM: originador 


Con el comando RCPT se identifican los receptores del mensaje. Se 
debe utilizar uno para cada receptor, y cada llamada da lugar a un 


campo de cabecera TO: en el mensaje. 


| RCPT TO: receptor | 


El comando DATA indica el inicio del envío del cuerpo del mensaje. 
Las líneas siguientes a este comando se tratan como contenido del 
mensaje. Este último se acaba con una línea que sólo incluye un pun- 


to; es decir, con la secuencia <CRLF>.<CRLF>. 


| DATA | 


Los datos que se envían dentro de este campo son mensajes RFC 822, 
por lo que pueden incluir campos de cabecera en el inicio. Cuando ello 
sucede, entre los campos de cabecera y el cuerpo del mensaje debe ha- 


ber una línea en blanco, es decir, la secuencia <CRLE><CRLF>. 


Una vez iniciada la transacción de envío de mensaje, y antes de aca- 
bar, el emisor SMTP siempre puede interrumpirla por medio del co- 


mando RSET. 





RSET 


El comando NOOP sirve para que el receptor SMTP envie una respuesta 


afirmativa para informar de que la conexión todavía está abierta. 


NOOP 


Para cerrar el canal de transmisión, el SMTP proporciona el coman- 
do QUIT. Cuando este último llega al receptor SMTP, éste envía una 


respuesta afirmativa y cierra el canal de transmisión. 


QUIT 


Funcionalidad adicional 


El protocolo STMP posibilita también una funcionalidad adicional 


con el objetivo de enviar mensajes a terminales. 


Para iniciar la entrega de un mensaje, o varios, a terminales, el emi- 


sor SMTP dispone del comando SEND. 





SEND FROM: originador 


| 


El comando SOML, permite iniciar la entrega de un mensaje, o varios, 
a terminales si el usuario se encuentra en el terminal, o, en caso con- 


trario, permite entregar el correo al buzón o a los buzones. 


SOML FROM: originador 


El comando SAMI, permite iniciar la entrega de un mensaje, o varios, 


a terminales y, al mismo tiempo, al buzón o a los buzones. 


SAML FROM: originador 


El emisor SMTP también puede pedir la confirmación de que una ca- 


dena identifica a un usuario por medio del comando VREY. 


VRFY cadena 
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El comando EXPN permite solicitar confirmación para una cadena 
que identifica una lista de correo y, en caso de respuesta positiva, re- 


querir la relación de los miembros de la lista. 


| EXPN cadena | 


El comando HELP permite pedir ayuda al receptor SMTP sobre los 





comandos que soporta. En caso de incluir una cadena como argu- 
mento, esta última puede identificar un comando, del que se retorna 


información específica. 


HELP [cadena] 


El comando TURN permite cambiar el papel de emisor SMTP y recep- 
tor SMTP. El resultado de la petición puede ser que el receptor SMTP 
envíe una respuesta afirmativa y haga el papel de emisor SMTP, o 


que envíe una respuesta negativa y mantenga su papel. 


TURN 


19.2.6. Códigos de respuesta 


El SMTP define una serie de códigos de respuesta para los diferentes 





comandos, tanto en caso de éxito (E), como en caso de resultado in- 
termedio (1), de fallo (F) y de error (X). La tabla siguiente recoge es- 


tos códigos: 





Tabla 12. 








Codigos de respuesta 
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211 Estatus del sistema o respuesta A 

a petición de ayuda T 

214 Mensaje de ayuda E 

220 El servidor está preparado E 
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Establecimiento 


Codigos de respuesta 


ez 


de connexión 





221 El servidor está cerrando 
el canal de transmisión 








250 Acción completada 
correctamente 












































251 Usuario no local, el mensaje 
se reenviará 











354 Principio de entrada de 
mensaje; es preciso acabar 
con <CRLF>.<CRLF> 


421 Servicio no disponible; cierre 
del canal de transmisión 





450 Acción no ejecutada: buzón 
no accesible 





451 Acción abortada por error local 





452 Acción abortada por 
capacidad de almacenamiento 
insuficiente 





500 Error de sintaxis; comando 
no reconocido 





501 Error de sintaxis 
en los parámetros o argumentos 





502 Comando no implementado 


503 Secuencia de comandos 
errónea 





504 Parámetro de comando no 
implementado 





550 Acción no ejecutada: buzón 
no encontrado 





551 Usuario no local; intentar otra 
dirección 





552 Acción abortada por exceso 
de capacidad almacenada 





553 Acción no ejecutada; nombre 
de buzón no permitido 





554 Fallo en la transacción 
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Lectura complementaria 





Para saber más sobre las ex- 
tensiones SMTP para mensa- 
jes de 8 bits, consultad las 
obras siguientes: 


J. Klensin; N. Freed; M. Rose; 
E. Stefferud; D. Crocker 
(1995, noviembre). RFC 1869 
- SMTP Service Extensions. 


J. Klensin; N. Freed; M. Rose; 
E. Stefferud; D. Crocker 
(1994, julio). RFC 1652 - SMTP 
Service Extension for 8bit- 
MIME transport. 
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19.2.7. Extensiones SMTP para mensajes de 8 bits 


Se consideró oportuno añadir un mecanismo para extender el SMTP. 
Cuando un cliente SMTP desea utilizar las extensiones SMTP, así como 
las extensiones para mensajes de 8 bits, tiene que solicitarlo al receptor 


SMTP con el comando EHLO en lugar del comando HELO: 


EHLO dominio 


Si el receptor SMTP soporta las extensiones, retorna una respuesta o 
más de éxito (250) e indica las extensiones de fallo (550) o de error 
(501) que soporta. Si el receptor no las soporta, retorna una respues- 
ta de error (500, 502, 504 ó 421). 


Una de las funcionalidades adicionales es la posibilidad de enviar 


mensajes de 8 bits. Cuando el servidor acepta mensajes de 8 bits, 





la respuesta de éxito (250) incluye la cadena 8BITMIME. Cuando 
se quiera enviar el mensaje, debe indicarse que es de 8 bits. Ello 


se aplica a los comandos MAIL, SEND, SAML o SOML de la mane- 





ra siguiente: 


MAIL FROM: originador BODY = valor-cuerpo 
SEND FROM: originador BODY = valor-cuerpo 
SAML FROM: originador BODY = valor-cuerpo 
SOML FROM: originador BODY = valor-cuerpo 





valor-cuerpo = 7BIT | 8BITMIME 


19.2.8. Ejemplo 


En este apartado se presenta un ejemplo en el que se puede observar 
la secuencia de comandos que envia un emisor SMTP (en negrita) y las 


respuestas del receptor SMTP en una transacción de envío de correo: 


220 peru.uoc.es SMTP/smap Ready. 

HELO campus.uoc.es 

250 (campus.uoc.es) pleased to meet you. 
HELP 


214-Commands 














214-HELO MATL RCPT DATA RSET 
214 NOOP QUIT HELP VREY EXPN 
NOOP 

220 OK 


EXPN xc@campus.uoc.es 


250-Jordi Inyigo <jinyigo@uoc.edu> 





250-Jose Barcelo<jbarcelo@uoc.edu> 
250-Llorenc Cerda <lcerda@uoc.edu> 


250-Ramon Marti <rmarti@uoc.edu> 





250-Enric Peig <epeig@uoc.edu> 

250 Xavier Perramon <xperramon@uoc.edu> 
MAIL FROM: jinyigo@uoc.edu 

250 jinyigo@uoc.edu... Sender OK 

RCPT TO: rmarti@uoc.edu 

250 rmarti@uoc.edu OK 

RCPT TO: rmarti@uoc.edu 

501 Syntax error 

RCPT TO: xperramon@uoc.edu 


250 xperramon@uoc.edu OK 


DATA 





354 Enter mail, end with "." on a line by itself 
Subject: Master de software libre 
Date: 20 Jun 2003 


Esto es un mensaje de correo de ejemplo. 


250 Mail accepted 
QUIT 


250 Closing connection 
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Nota 





Telnet como cliente genérico de los protocolos 


El programa telnet está pensado para hacer de 
cliente de servidores del protocolo Telnet. Sin embar- 
go, si se considera que lo que hace es enviar al servi- 
dor cadenas de caracteres tal como se introducen por 
el teclado y devolver por pantalla lo que recibe del ser- 
vidor, también se puede utilizar como cliente SMTP 
puesto que, como hemos comentado al describirlo, los 
mensajes que se intercambian en este protocolo son 
cadenas de caracteres ASCII. Este mismo razonamien- 
to se puede aplicar al resto de protocolos que vere- 
mos: POP3, IMAP, NNTP y HTTP. 


De este modo, si se utiliza el programa telnet como 
cliente SMTP, se pueden enviar comandos SMTP al 
servidor escribiéndolos por el teclado y viendo sus res- 
puestas por pantalla. Para ello, el programa telnet ad- 
mite como segundo parámetro el número de puerto 


donde debe conectarse. 


Por ejemplo, el diálogo anterior se podría haber rea- 


lizado haciendo: 


telnet peru.uoc.es 25 








| 19.3. Acceso simple a los buzones de correo: el POP3 


En sistemas pequeños no es práctico, ni usual, soportar el SMTP, 
puesto que implica tener el sistema conectado y dispuesto a recibir 
mensajes en cualquier momento. Por este motivo, se vio la necesidad 
de definir un protocolo que permitiera la recuperación de mensajes 


de buzones de correo remotos y se definió el POP3. 





Nota 


El POP y el POP2, dos protocolos definidos en las RFC 
918 y RFC 937 respectivamente, parten de la misma 





filosofía que el POP3; sin embargo, disponían de un 


conjunto de comandos más reducido. 


No obstante, en este protocolo es preciso disponer de sistemas en los 
que se encuentren los buzones —un servidor POP3-, y deben estar co- 
nectados en todo momento, tanto para recibir los mensajes, como 
para recibir las peticiones de acceso a los buzones. Por lo que res- 
pecta a los clientes POP3, sólo es necesario que se conecten cuando 


quieran acceder a su correo. 


El POP3 no especifica ningún método para el envío de correo; otros 
protocolos de transferencia de correo, como el SMTP, proporcionan 


esta funcionalidad. 


19.3.1. Modelo del POP3 


El modelo funcional del POP3 se basa en los elementos siguientes: 


e Agente de usuario: utiliza el cliente POP3 para acceder a su 


correo. 


e Cliente POP3: se comunica con el servidor POP3 por medio del 


protocolo POP3 para acceder a su buzón de correo. 


¢ Servidor POP3: recibe peticiones de los clientes POP3 y se las sir- 


ve accediendo a los buzones correspondientes. 


En la figura siguiente se presentan los elementos del modelo funcio- 
nal del POP3 integrados en un sistema en el que se utiliza el SMTP 


para enviar el correo, y el POP3 para acceder a los buzones: 





Figura 85. 
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Lectura complementaria 


Si queréis más información 
sobre el SMTP, consultad la 
obra siguiente: 

J. Myers; M. Rose (1996, 
mayo). RFC 1939 - Post 
Office Protocol - Version 3 
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19.3.2. Conceptos bdsicos del POP3 


El POP3 se basa en comunicaciones TCP sobre el puerto 110. 


El mecanismo normal de utilización de dicho protocolo es el siguiente: 


cuando el cliente POP3 necesita acceder al buzón, se conecta con el ser- 


vidor POP3, recupera la información que le interesa y cierra la conexión. 


Cada vez que sea necesario volver a acceder al buzón, se establece 


una nueva conexión. 


Los comandos POP3 constituyen cadenas de caracteres ASCII im- 
primibles acabados con <CRLF>. Todos los comandos incluyen 
un código alfanumérico de cuatro caracteres que identifica el co- 


mando, seguido de cero o más parámetros. 


Las respuestas POP3 también son cadenas de caracteres ASCII, 


y se representan con un indicador de estado positivo (+OK) o ne- 





gativo (-ERR) y, posiblemente, información adicional, de la ma- 


nera siguiente: 


+OK el comando se ha ejecutado con éxito 





-ERR el comando no se ha ejecutado con éxito 


Estados 


La norma define tres estados por los que debe pasar toda sesión 
POP3: 


Una vez se ha abierto la conexión, la sesión entra en el estado de 
autorización, en que el cliente debe identificarse ante el servidor 
POP3, 


Una vez autorizado, la sesión pasa al estado de transacción. En 
este último, el cliente pide acciones al servidor POP3 con los co- 


mandos necesarios. 


Cuando el cliente llama el comando QUIT, la sesión entra en el 
estado de actualización. El servidor libera los recursos, se despi- 


de y cierra la conexión TCP. 


19.3.3. Funcionalidad del POP3 


Desde el punto de vista de funcionalidad, y retomando los plantea- 
mientos del correo postal, el POP3 proporciona los comandos nece- 
sarios para el acceso a buzones de correo. A continuación, 
describiremos los comandos correspondientes a cada uno de los es- 


tados por los que debe pasar una sesión POP3: 

1) Estado de autorización. En este estado el cliente se identifica ante 
el servidor POP3. Para realizar el proceso de identificación, se dis- 
pone de los comandos siguientes: 


a) Identificación de usuario (USER) 


Lo primero que debe hacer un cliente POP3 es identificarse ante 


el servidor POP3. Uno de los métodos es hacerlo mediante el co- 





mando USER, dentro del cual se envía el nombre que identifica al 


usuario. 


| USER nombre | 


b) Envío de la contraseña (PASS) 





Una vez identificado el usuario mediante el comando USER, debe 
llevarse a cabo la autenticación por medio del envío de una contra- 
seña con el comando PASS. El servidor utiliza la cadena enviada en 
este último junto con el nombre de usuario para dar acceso al usua- 


rio al buzón o denegárselo. 


PASS contraseña 


c) Identificación y autenticación del usuario con seguridad (APOP) 


El método de identificación y autenticación mediante los comandos 





USER y PASS tiene el problema de que tanto el nombre como la con- 
traseña viajan por la red sin ningún mecanismo de seguridad. Un 
método alternativo de identificación y autenticación del usuario con- 
siste en utilizar el comando APOP, que incorpora mecanismos de se- 


guridad en el envío de la contraseña. 


APOP nombre resumen 
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Nota 





El comando APOP actúa de la manera siguiente: 


Al conectarse, el servidor envía una cadena al cliente. 
Este último concatena la cadena recibida a la contrase- 
ña y crea un resumen de la misma por medio de un al- 
goritmo de creación de resúmenes (hash criptográfico). 
Este resumen se envía junto con el nombre identificativo 


del usuario como argumentos del comando APOP. 


El servidor, para verificar el ususario, genera el mismo 


resumen y lo compara con el que ha recibido. 








2) Estado de transacción. En este estado, el cliente solicita acciones 


al servidor POP3. Las acciones que puede pedir son las siguientes: 
a) Estado (STAT) 


Una vez autenticado el usuario, el cliente POP3 puede requerir infor- 
mación sobre el estado del buzón del usuario por medio del coman- 
do STAT que no tiene argumentos y devuelve el número de mensajes 


y los bytes que ocupa el buzón del usuario. 


STAT 


b) Listado (LIST) 


Cuando ya se sabe el número de mensajes que hay en el buzón, el 
paso siguiente es la petición de información sobre uno de los men- 
sajes o sobre todos. El POP3 proporciona el comando LIST para 
esta tarea. Este comando devuelve, para cada mensaje, un número 


de mensaje y los bytes que ocupa. 
LIST [mensaje] 
c) Recuperación de mensajes (RETR) 


Una vez se conocen los mensajes que hay en el buzón, deben recu- 


perarse los que quiere leer. Ello puede hacerlo el cliente POP3, para 





cada mensgje, con el comando RETR, que incluye como argumento 


el identificador del mensaje que se quiere recuperar. 


RETR mensaje 


d) Borrado de mensajes (DELE) 











Tras leer un mensaje, puede interesar borrarlo. El comando DELE in- 





dica al servidor POP3 que marque como mensaje a borrar el identi- 
ficado como tal en el argumento; sin embargo, el mensaje no se 


borrará hasta que no se entre en el estado de actualización. 


DELE mensaje 


e) Operación nula (NOOP) 


El comando NOOP sirve para saber si la conexión con el servidor to- 
davía está abierta. Con dicho comando, el servidor POP3 no hace 


nada, excepto devolver una respuesta afirmativa. 


NOOP 


f) Desmarcado de mensajes para borrar (RSET) 














Una vez se ha llevado a cabo una llamada al comando DELE, y an- 


tes de entrar en el estado de actualización, el usuario puede echarse 





atrás y pedir al servidor POP3, mediante el comando RSET, que des- 


marque todos los mensajes marcados para borrar. 


RSET 


g) Recuperación de la parte superior de un mensaje (TOP) 


En ocasiones, puede interesar recuperar sólo la parte superior de un 
mensaje para decidir si vale la pena recuperarlo todo o no. El co- 
mando TOP permite recuperar la cabecera y n líneas del mensaje 


identificado en el argumento. 


TOP mensaje n 
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h) Lista de identificadores Únicos (UIDL) 


Todos los mensajes del buzón tienen un identificador Único (unique- 


id) permanente (a diferencia del número de mensaje, que es Único 





dentro del buzón, pero que puede ir variando). El comando UIDL 
permite obtener el número de mensaje y el identificador Unico de uno 


de los mensajes del buzón o de todos. 


| UIDL [mensaje] | 


i) Paso al estado de actualización (QUIT) 


Una vez finalizadas las transacciones, el cliente POP3 debe llamar el 





comando QUIT para pasar al estado de actualización. 


3) Estado de actualización. En este estado, el servidor POP3, en 
primer lugar, borra todos los mensajes marcados para borrar y, 
con posterioridad, libera todos los recursos y cierra la conexión 


TCP. El estado de actualización no dispone de ningún comando 


asociado. 





19.3.4. Ejemplo 


A continuación, se presenta un ejemplo de los comandos de acceso 
de un cliente POP3 (en negrita) a un servidor POP3 para recuperar 


el mensaje enviado en el ejemplo anterior: 


+OK QPOP (version 2.52) at pop.uoc.es starting. 
USER rmarti 





+OK Password required for rmarti. 


PASS prueba 





-ERR Password supplied for "rmarti" is incorrect. 
+OK Pop server at pop.uoc.es signing off. 
PASS password 

+OK rmarti has 6 message(s) (190885 bytes). 
STAT 

+OK 6 190885 

LIST 

+OK 6 messages (190885 bytes) 

3140 

3326 

1911 

180846 

861 

801 





O oO FPF W N 


RETR 6 
+OK 801 
Received: from campus.uoc.es by peru.uoc.es 


(8.8.5/8.8.5) with ESMTP id SAA14826 





for <rmarti@uoc.edu>; Fri, 27 Jun 2003 


18:35:52 +0200 (MET DST) 








From: Jordi Inyigo <jinyigo@uoc.edu> 

Message-Id: 
<199809211639.SAA20364@peru.uoc.es> 

To: rmarti@uoc.edu, xperramon@uoc.edu 

Subject: Master de software libre 

Date: 27 Jun 2003 

Content-Type: text 

Status: RO 











Est s un mensaje de correo d jemplo. 


QUIT 


+OK Pop server at dns signing off 
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El IMAP4rev1 surgié de la 
evolución de las especifica- 


ciones IMAP2 [RFC 1176], 
IMAP3 [RFC 1203] e IMAP4 
[RFC 1730]. 


Lectura complementaria 


Si queréis más información 
sobre el IMAP4rev1, consul- 
tad la obra siguiente: 

M. Crispin (1996, deciem- 
bre). RFC 2060 - Internet 
Message Access Protocol - 
Version 4rev1. 
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19.4. Acceso complejo a los buzones de correo: 
el IMAP4rev1 


El protocolo de acceso a mensajes Internet, versión 4revl, 
IMAP4rev1, permite al cliente acceder a los mensajes de correo 


electrónico de un servidor y manipularlos. 


El IMAP4rev1 (a partir de ahora lo llamaremos IMAP4) permite al 
usuario disponer de diferentes buzones estructurados de manera je- 
rárquica y, al mismo tiempo, poderlos manipular de manera remota, 


tal como se hace con los buzones locales. 


El IMAP4 también proporciona a los clientes la capacidad de resin- 


cronización con el servidor. 


El IMAP4 no especifica ningún método para el envío de correo; otros 
protocolos de transferencia de correo, como el SMTP, proporcionan 


esta funcionalidad. 


19.4.1. Modelo del IMAP4 


El modelo funcional del IMAP4 se basa en los elementos que presen- 


tamos a continuación: 


+ Agente de usuario: utiliza el cliente IMAP4 para leer el correo de 


su buzón. 


* Cliente IMAP4: se comunica con el servidor IMAP4 por medio del 


IMAP4 para acceder a su buzón de correo. 


e Servidor IMAPA: recibe peticiones de los clientes IMAP4 y se las 


sirve accediendo a los buzones correspondientes. 


La figura siguiente presenta los elementos del modelo funcional del 
IMAP4 integrados en un sistema en el que se utiliza SMTP para enviar 


el correo e IMAP4 para acceder a los buzones: 





Figura 86. | 








19.4.2. Conceptos básicos del IMAP4 


El IMAP4 puede utilizarse con cualquier protocolo de transporte fia- 
ble. Por norma general, se utiliza el TCP y, en este caso, se utiliza el 
puerto 143. Todas las interacciones entre cliente y servidor se llevan 


a cabo en forma de líneas ASCII acabadas con un carácter <CRLF>. 


Cada comando del cliente empieza con un identificador (por lo ge- 
neral, una cadena alfanumérica corta) llamado tag. El cliente debe 


generar un tag diferente para cada comando. 


El servidor puede enviar datos tanto en respuesta a un comando del 
cliente, como de manera unilateral, y el cliente debe estar a punto 
para recibirlos en todo momento. Los datos transmitidos por el ser- 
vidor hacia el cliente y las respuestas de estatus que no implican la 
finalización del comando empiezan con el token. La respuesta final 
de culminación de comando empieza con el mismo tag que el co- 


mando del cliente que ha dado lugar a la respuesta. 
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Además de las respuestas específicas de cada comando, casi todos 
los comandos disponen, como mínimo, de los resultados de estatus 


siguientes: 


OK [Parámetros]: el comando se ha ejecutado. 
NO [Parámetros]: el comando no se ha ejecutado. 


BAD [Parámetros]: comando desconocido o argumentos inválidos. 





Ejemplo 
Consultad el comando OS 
* BYE IMAP4revl server terminating connection 
a006 OK LOGOUT completed 


LOGOUT en el apartado 
1 AS 








La primera línea es la llamada al comando precedida 
del tag (a006). En este caso, el comando LOGOUT. 
Después, se puede observar la respuesta, que está 
formada por dos líneas. La última línea de la res- 
puesta empieza con el mismo tag que la llamada, 
mientras que las líneas anteriores lo hacen con el 


token. 





El cliente puede enviar un comando después de otro sin esperar el 
resultado del primero. De manera similar, un servidor puede empe- 
zar a procesar un comando antes de acabar de procesar el que se 


ejecuta en aquel momento. 


Además del texto, cada mensaje tiene asociados diferentes atributos 
que se encuentran almacenados dentro del buzón y que son son los 


siguientes: 


1) Identificador único (UID, unique identifier): a cada mensaje se 
le asocia un valor de 32 bits que, cuando se utiliza conjuntamente 
con los valores de validez de identificador único (unique identifier 
validity value), forma un valor de 64 bits que identifica de manera 
única un mensaje dentro de un buzón. Los UID se asignan de ma- 
nera ascendente dentro del buzón, pero no necesariamente de 


manera contigua. 


2) Número de secuencia del mensaje (message sequence number): 
este atributo proporciona la posición relativa del mensaje den- 


tro del buzón, desde el 1 hasta al número total de mensajes. 


264 


Esta posición debe ordenarse siguiendo los UID ascendentes. Los nú- 


meros de secuencia del mensaje se pueden reasignar durante la se- 


sión (por ejemplo, cuando se elimina un mensaje del buzón). 


3) 


4 


— 


5 


— 


6 


— 


7 


— 


8 


— 


Indicadores: cada mensaje tiene asociada una lista de cero indi- 

cadores, o más, que informan del estado: 

* XSeen: mensaje leído 

e MAnswered: mensaje contestado 

* XFlagged: mensaje marcado por atención urgente/especial 

+ ADeleted: mensaje marcado para ser borrado por un Expunge 
posterior 

* ADraft: mensaje no editado del todo 


+ MRecent: mensaje acabado de llegar en esta sesión 


Fecha interna (internal date): fecha y hora que cada mensaje lle- 
va asociadas de manera interna dentro del servidor, que reflejan 
cuándo ha llegado el mensaje al servidor. No es la fecha del 
mensaje RFC 822. 


Longitud [RFC 822] ([RFC 822] size): es el número de bytes del 


mensaje expresado en el formato RFC 822. 


Estructura del sobre (envelope structure): representación anali- 
zada de la información del sobre RFC 822. 


Estructura del cuerpo (body structure): representación analizada 


de la información de la estructura del cuerpo MIME. 


Textos de mensaje: además de permitir la recuperación de los 
mensajes RFC 822 enteros, con el IMAP4 también se pueden efec- 
tuar recuperaciones parciales. En concreto, permite recuperar la 
cabecera y/o el cuerpo del mensaje RFC 822, una parte del cuer- 
po MIME o una cabecera MIME. 


El IMAP4 especifica cuatro estados: 


Estado no autenticado: el cliente debe proporcionar sus creden- 
ciales. Se llega a este estado cuando se empieza una conexión, 


salvo que ya se haya preautenticado. 


Estado autenticado: el cliente debe seleccionar un buzón al que 
accederá antes de tener permiso para efectuar comandos sobre 


los mensajes. 
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+ Estado seleccionado: se entra en este estado cuando se ha selec- 


cionado con éxito un buzón. 


e Estado de logout: la conexión se acaba y el servidor la cerrará. 
Se puede entrar en este estado como resultado de una petición 


del cliente o de manera unilateral por parte del servidor. 


La figura siguiente muestra el diagrama de flujo entre los diferentes 
estados definidos por el IMAP4: 





Figura 87. 








¡ATT ETIA eel masly 
preoutenticacién preautenticacon 


. 
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AUTHENTICATE ta 


SELECT o EXAMINE 
AO 


LOGOUT, shutdown o cierre de conexión 


yy E 
a re e] 





Cada usuario tiene su correo en el servidor, depositado en un con- 
junto de buzones estructurados jerárquicamente que se pueden ma- 


nipular remotamente a través del IMAP4. 





Nota 





Aunque el IMAP4 utiliza la palabra buzón para identificar 
todos los sitios donde se pueden guardar mensajes, en 
realidad lo que se entiende por buzón donde se reciben 
los mensajes es la bandeja de entrada (buzón inbox), 
mientras que los otros buzones son más bien carpetas en 


las que se clasifican estos mensajes recibidos. 
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Cada buzón se identifica por un nombre relativo, una cadena de carac- 
teres que lo diferencia de los buzones hermanos. Asimismo, cada buzón 
dispone de un nombre que lo identifica dentro de la estructura formada 
por la secuencia de los nombres relativos de los buzones que definen los 
niveles de jerarquía superiores, de izquierda a derecha, separados con un 
Único carácter (por norma general, el carácter “/”). Debe utilizarse el mis- 


mo separador en todos los niveles de la jerarquía dentro de un nombre. 


19.4.3. Funcionalidad del IMAP4 


La funcionalidad proporcionada por el IMAP4, como la del POP3, 
imita la que se requiere para el acceso a los buzones de correo pos- 
tal. Como mejora respecto al POP3, el IMAP4 proporciona una es- 
tructura jerárquica del buzón en forma de carpetas, así como 
facilidades de suscripción, lo que da lugar a nuevos comandos que 


permiten gestionar todos estos elementos. 


Las funciones que se utilizarán según el estado en que se encuentre 


la comunicación serán las siguientes: 


1) Cualquier estado (comandos/estados universales). Sea cual sea el 


estado de la conexión, se pueden utilizar los comandos siguientes: 


a) Petición de capacidades (CAPABILITY) 





El comando CAPABILITY, que no tiene ningún argumento, sirve 


para solicitar la lista de capacidades que soporta el servidor 


CAPABILITY 


b) Operación nula (NOOP) 


El comando NOOP permite al cliente IMAP4 averiguar si la co- 


nexión con el servidor todavía está abierta. 


NOOP 


c) Finalización de conexión (LOGOUT) 


El comando LOGOUT permite al cliente notificar al servidor que 


quiere acabar la conexión. 


LOGOUT 
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2) 


3) 


Estado no autenticado. En este estado, un cliente proporciona 


sus credenciales; para ello, se utilizan los comandos siguientes: 


a) Indicador de autenticación (AUTHENTICATE) 








El comando AUTHENTICATE sirve para indicar al servidor IMAP4 
un mecanismo de autenticación; es decir, cuál de los diferentes 


mecanismos de autenticación posibles utiliza el cliente. 
| aurnewticare tipo autenticación | 


b) Identificación de usuario (LOGIN) 


Como todo protocolo, el IMAP4 proporciona un comando para 
permitir que el cliente se identifique ante el servidor por medio del 
envío de un identificador de usuario y una contraseña. Este co- 


mando es LOGIN. 


LOGIN id_usuario contraseña 


Estado autenticado. En este estado el IMAP4 proporciona algu- 


nas funcionalidades nuevas: 











a) Selección de un buzón (SELECT) 





Una vez autenticado, el cliente IMAP4 puede seleccionar un buzón 














para acceder a sus mensajes. El comando SELECT proporciona 


esta funcionalidad. 


SELECT buzón 


Este comando, además de los resultados de estatus, retorna las 


respuestas obligatorias sin tag siguientes: 


FLAGS: ¡informa de los identificadores que se pueden 


aplicar al buzón del comando. 





EXISTS: número de mensajes existentes en el buzón. 














RECENT: número de mensajes con el indicador Recent. 





También puede retornar las respuestas OK sin tag: 





NSEEN: número del primer mensaje sin el indicador Seen. 


























PERMANENTFLAGS: lista de indicadores que pueden modificarse 


permanentemente. 


b) Examen de un buzón (EXAMINE) 














El comando EXAMINE permite un acceso al buzón similar al del 











comando SELECT, pero de manera que el buzón sea sólo de lec- 





tura. Este comando, además de los resultados de estatus, puede 











retornar las mismas respuestas que el comando SELECT. 





EXAMINE buzón 


c) Creación de un buzón (CREATE) 


Al usuario le puede interesar crear un buzón con un nombre de- 














terminado. El IMAP4 proporciona el comando CREATE para ello. 


CREATE buzón 


d) Borrado de un buzón (DELETE) 


El IMAP4 también facilita la eliminación permanente de un buzón 

















con un nombre determinado por medio del comando DELETE. 


DELETE buzón 


e) Renombramiento de un buzón (RENAME) 


En ocasiones, el usuario desea cambiar el nombre de un buzón 


por uno nuevo. El cliente IMAP4 puede solicitar esta acción al ser- 











vidor por medio del comando RENAME. 





RENAME buzón nuevobuzon 


f) Suscripción de un buzón (SUBSCRIBE) 


En el IMAP4, no es preciso que todos los buzones estén activos a 





ey 





E, el nombre del bu- 





cada momento. Con el comando SUBSCRI] 





zón pasa a formar parte de la lista de buzones activos o suscritos. 


SUBSCRIBE buzón 


g) Eliminación de la suscripción de un buzón (UNSUBSCRIBE) 














El comando UNSUBSCRIBE permite desactivar un buzón elimi- 


nando su nombre de la lista de buzones activos o suscritos. 


UNSUBSCRIBE buzón 


269 


270 


h) Listado de buzones (LIST) 


El comando LIST permite obtener los nombres de buzones que 
cumplen los criterios de búsqueda deseados dentro de un buzón 


de referencia. 


LIST buzón 1*criterio búsqueda 


Este comando, además de los resultados de estatus, puede retor- 


nar la respuesta sin tag siguiente: 


LIST: nombre del buzón que cumple los criterios 


de búsqueda deseados. 


Puede haber más de una respuesta LIST. 


i) Listado de buzones suscritos (LSUB) 








El comando LSUB permite obtener los nombres de los buzones 
activos o suscritos que cumplen los criterios de búsqueda desea- 


dos dentro de un buzón de referencia. 


LSUB buzón 1*criterio búsqueda 


Este comando, además de los resultados de estatus, puede retor- 


nar la respuesta sin tag siguiente: 


LSUB: nombre del buzón que cumple los criterios de búsqueda 


deseados. 





Puede haber mds de una respuesta LSUB. 


j) Estado del buzón (STATUS) 
El comando STATUS permite conocer el estado de un buzón. 


Los atributos de estado definidos son los siguientes: 








* MESSAGE: número de mensajes en el buzón. 
e REC 











T 


NT: número de mensajes con el indicador \Recent. 











e UIDNEXT: UID que se asignará al mensaje siguiente que lle- 
gue al buzón. 
e UIDVALIDITY: valor del UID del buzón. 





+ UNS 


T 








¡EN: número de mensajes sin el indicador \ Seen. 


STATUS buzón 
(l#atributo_estado) 





4) 


Este comando, además de los resultados de estatus, puede retor- 


nar la respuesta sin tag siguiente: 


STATUS: nombre de buzón que cumple el estatus deseado y 


la información de estatus requerida. 


k) Añadido de un mensaje al buzón (APPEND) 





El comando APPEND permite al cliente el IMAP4 añadir un texto 
literal como nuevo mensaje al final de un buzón seleccionado, 


con la fecha, la hora y los indicadores deseados. 
APPEND buzón[lista flags] 
[fecha hora] literal 


Estado seleccionado. En el estado seleccionado, el IMAP4 pro- 
porciona nuevas funcionalidades, además de los comandos uni- 


versales y los del estado autenticado: 


a) Control del buzón (CHECK) 





El comando CHECK permite al cliente IMAP4 pedir al servidor un pun- 


to de control del buzón seleccionado en un momento determinado. 


CHECK 


b) Cierre del buzón (CLOSE) 





El comando CLOSE permite cerrar un buzón seleccionado y elimi- 
nar permanentemente todos sus mensajes que tienen el indicador 


\Deleted. 


CLOSE 


c) Eliminación de mensajes (EXPUNGE) 














El comando EXPUNGE permite eliminar de manera permanente to- 
dos los mensajes que tienen el indicador \Deleted del buzón selec- 


cionado y sin necesidad de cerrarlo. 


EXPUNGE 


Este comando, además de los resultados de estatus, puede retornar 


la respuesta sin tag siguiente: 














EXPUNGE: número de secuencia de mensaj specificado que 





ha sido eliminado permanentemente. 
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d) Busqueda de mensaje (SEARCH) 


El comando SEARCH permite al cliente IMAP4 buscar dentro del 





buzón los mensajes que contienen un conjunto de caracteres es- 


pecificado y que cumplen unos criterios de búsqueda deseados. 


SEARCH [CHARSET 
conjunto caracteres] 


l#criterio_ busqueda 





Este comando, además de los resultados de estatus, puede retor- 


nar la respuesta sin tag siguiente: 





SEARCH: un número de secuencia o más de los mensajes que 





cumplen el criterio de búsqueda deseado. 


e) Recuperación de mensajes (FETCH) 





El comando FETCH permite la recuperación de un conjunto de 
mensajes (total o parcialmente), especificando unos atributos de 


recuperación. 


FETCH conjunto mensajes ALL |FULL 
| FAST | 





atrib_recupl(lfatrib_recup) 


Este comando, además de los resultados de estatus, puede retor- 


nar la respuesta sin tag siguiente: 





FETCH: información del mensaje que presenta los atributos 


de recuperación especificados. 


f) Modificación de almacén (STORE) 





El comando STORE permite modificar los indicadores del almacén 


que proporcionan los atributos a un conjunto de mensajes del buzón. 


STORE conjunto mensajes 
indicadores atrib almacén 


Este comando, además de los resultados de estatus, puede retor- 


nar la respuesta sin tag siguiente: 





FETCH: información de los mensajes. 


g) Copia de mensaje(s) (COPY) 


El comando COPY permite copiar un conjunto de mensajes al final 


de un buzón especificado. 


COPY conjunto mensajes buzón 


h) Retorno de identificador Unico (UID) 





La sentencia UID, seguida de los pardmetros COPY, FETCH, STO- 














RE O SEARCH, en lugar de retornar el número o números de se- 


cuencia de mensaje, retorna sus identificadores Únicos. 





UID (COPY ... | FETCH ... | 
SEARCH ... | STORE ...) 


Este comando, además de los resultados de estatus, puede retor- 


nar las respuestas sin tag siguientes: 


FETCH: información del mensaje que presenta los atributos 


de recuperación especificados. 





SEARCH: un UID o más indican los mensajes que cumplen el 


criterio de búsqueda deseado. 


5) Experimental/expansión 


Comando experimental (X<atom>) 


El IMAP4 permite especificar comandos experimentales que no son 
una parte de la especificación, siempre que su nombre empiece con 


el prefijo X. 


Xl*carácter 


19.4.4. Ejemplo 


A continuación, se presenta un ejemplo de los comandos de un clien- 
te IMAPA (en negrita) que accede a un servidor IMAP4 para entrar en 
sus buzones. En el ejemplo se ve cómo se recupera la información 
del mensaje 12 (fetch 12 full). En la información retornada por 
el servidor, se ve la información “parseada” de la cabecera. A conti- 
nuación, se recupera toda la cabecera del mismo mensaje 
(fetch12 body [header]). Al final, antes de cerrar la conexión, 


se marca el mensaje para que sea borrado. 


* OK IMAP4revl Service Ready 

a001 login rmarti secret 

a001 OK LOGIN completed 

a002 select inbox 

* 18 EXISTS 

* FLAGS (\Answered \Flagged \Deleted \Seen \Draft) 
* 2 RECENT 
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* OK [UNSEEN 17] Message 17 is the first unseen message 
* OK [UIDVALIDITY 3857529045] UIDs valid 

a002 OK [READ-WRITE] SELECT completed 

a003 fetch 12 full 

* 12 FETCH (FLAGS (\Seen) INTERNALDATE "27-Jun-2003 
02:44:25 -0700" RFC 822.SIZE 4286 ENVELOPE 

("Fri, 27 Jun 2003 02:23:25 -0700 (PDT)" 

"EjJemplo de acceso IMAP4rev1" 

("Jordi Inyigo" NIL "jinyigo" "uoc.edu") ) 

("Jordi Inyigo" NIL "jinyigo" "uoc.edu") ) 

("Jordi Inyigo" NIL "jinyigo" 

(NIL NIL "rmarti" "uoc.edu")) 

(NIL NIL "xperramon" "uoc.edu") 


( 
( 
( 
( 
( 
("JM Marques" NIL "jmmarques" "uoc.edu") ) 


NIL NIL 
“<B27397-0100000@uoc.edu>") 
BODY ("TEXT" "PLAIN" ("CHARSET" "US-ASCII") NIL NIL 


"7BIT" 3028 92)) 
a003 OK FETCH completed 
a004 fetch 12 body [header] 
* 12 FETCH (BODY[HEADER] (350) 
Date: Fri, 27 Jun 2003 02:23:25 -0700 (PDT) 
From: Jordi Inyigo <jinyigo@uoc.edu> 
Subject: Ejemplo de acceso IMAP4revl 
To: rmarti@uoc.edu 
cc: xperramon@uoc.edu, 
JM Marques <jmmarques@uoc.edu> 
Message-Id: <B27397-0100000@uoc.edu> 
MIME-Version: 1.0 
Content-Type: TEXT/PLAIN; CHARSET=US-ASCII 


) 

a004 OK FETCH completed 

a005 store 12 +flags \deleted 

* 12 FETCH (FLAGS (\Seen \Deleted)) 

a005 OK +FLAGS completed 

a006 logout 

* BYE IMAP4revl server terminating connection 
a006 OK LOGOUT completed 


| 19.5. Extensiones multimedia: el formato MIME 


La norma RFC 822 define un formato de mensaje y un contenido con una 
única parte de texto en ASCII de 7 bits. Se vio que este formato era muy 


pobre y que se precisaba algún método para superar sus limitaciones. 


El formato MIME (multipurpose Internet mail extensions) redefine el 
formato del mensaje para permitir, sin perder la compatibilidad con 


el formato definido por el RFC 822, las características siguientes: 


e Contenido de texto no sólo ASCII de 7 bits. 
e Contenido no texto. 
e Contenido con múltiples partes. 


+ Cabeceras con texto no sólo ASCII de 7 bits. 


19.5.1. Nuevos campos de cabecera 


Para permitir todas las nuevas extensiones, el MIME define nuevos 





campos de cabecera: MIME-Version, Content-Type, Content- 





Transfer-Encoding, Content-ID y Content-Description. 


Indicador de versión (MIME-Version) 





El campo de cabecera MIME-Version indica la versión MIME que 
se utiliza en el mensaje (la versión de MIME que se utiliza actualmen- 
te, y que especificamos en este apartado, es la 1.0.). Este campo es 
útil para que el receptor del mensaje pueda interpretar los campos 
de cabecera MIME. 


MIME-Version: 1*digit.1*digit 





Indicador del tipo y subtipo de datos (Content-Type) 


El campo de cabecera Content-Type permite indicar los tipos y 
subtipos de los datos que se encuentran dentro del mensaje. De 
este modo, el receptor podrá conocer los tipos de datos que contie- 
ne el mensaje y podrá visualizarlos adecuadamente. Según el tipo 


o subtipo de dato, puede incluir algún parámetro adicional. 


Content-Type: tipo/subtipo *(; parámetro) 

tipo = tipo-discreto | tipo-compuesto 
tipo-discreto = text | image | audio | video | 
application | extension-token 

tipo-compuesto = message | multipart | 


extension-token 





Para obtener más información sobre el formato de 





mensajes MIME, podéis consultar las obras siguientes: 


N. Freed; N. Borenstein (1996, noviembre). RFC 
2045 - Multipurpose Internet Mail Extensions (MIME) 


Part One: Format of Internet Message Bodies. 
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N. Freed; N. Borenstein (1996, noviembre). RFC 
2046 - Multipurpose Internet Mail Extensions (MIME) 
Part Two: Media Types. 


K. Moore (1996, noviembre). RFC 2047 - MIME 
(Multipurpose Internet Mail Extensions) Part Three: 
Message Header 

Extensions for Non-ASCII Text. 


N. Freed; J. Klensin; J. Postel (1996, noviembre). RFC 
2048 - Multipurpose Internet Mail Extensions (MIME) 


Part Four: Registration Procedures. 


N. Freed; N. Borenstein (1996, noviembre). RFC 
2049 - Multipurpose Internet Mail Extensions (MIME) 


Part Five: Conformance Criteria and Examples. 








La norma define cinco tipos de contenido (tipo-discreto), con 
los subtipos correspondientes. Estos tipos corresponden a datos mo- 


nomedia: 


* text: para información de texto. 

e image: para imágenes. 

* audio: para sonido. 

e video: para vídeo. 

e application: para cualquier otro tipo de datos, por norma ge- 


neral en formato específico de alguna aplicación. 


La norma también define dos tipos de datos compuestos (tipo- 


compuesto): 


e multipart: para datos formados de muchas partes o para da- 


tos independientes dentro de un mismo mensaje. 





Nota 





En los mensajes de tipo multipart, el parámetro 
boundary incluye una cadena, precedida por dos ca- 


a“ “a 


racteres de guión, , que se utiliza como separador 


entre las diferentes partes del mensaje. 








Para indicar que se han acabado todas las partes, se 


utiliza la cadena del pardmetro boundary, precedida y 


seguida de dos caracteres de guión, “--”. 


* message: para encapsular otro mensaje dentro del mensaje. 


La tabla siguiente presenta los valores de tipo, subtipo y parámetros 


para los Content-Type definidos en la norma: 








Tabla 13. 





Valores definidos para Content-Type 





plain 


1S0-8859- (1 





enriched 


1S0-8859- (1 





gif 





jpeg 





basic 


mpeg 


quicktime 





application 


multipart 


octet-stream 


type = cadena; 


padding = 


entero 





postscript 


mixed 


boundary 


cadena 





alternative 


boundary 


cadena 





parallel 


digest 


boundary 


boundary 


cadena 


= cadena 








message 


rfc 822 





partial 


id = cadena; 


number = 
{[;total = 


entero 


entero ] 








external-body 





access-type = ftp | 


afs | loc 
¡expirat 
¡size = 
;permiss 
¡name = 


;site = 


¿mode = 
ascii | e 


¡Server 





; subject 


al-file | 


ion = date-time 


entero ] 
ion=read | 
cadena ] 


cadena ] 


;dir = cadena ] 


netascii | 
bedic | 


= cadena ] 


image 


= cadena ] 
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anon-ftp | 


octet 


mail-server 


] 


read-write] 


| mail 


localn 


] 


tftp 





278 


Especificador del tipo de codificación (Content-Transfer- 
Encoding) 


En algunos protocolos, como el SMTP, la información que se envía 
debe ser en ASCII de 7 bits. En ocasiones, los datos originales no ten- 
drán este formato y, entonces, será preciso aplicarles algún tipo de 


codificación antes de enviarlos. 





El campo de cabecera Content-Transfer-Encoding sirve para 
especificar el tipo de codificación que se ha aplicado al contenido del 
mensaje para que el receptor pueda descodificarlo, si es preciso. La 


norma define diferentes tipos de codificación: 





a) Codificación 7bit | 8bit | binary 


Los mecanismos de codificación 7bit, 8bit y binary sólo sirven 
para indicar de qué tipo son los datos transmitidos. En estos casos, 
los datos no se codifican y, por norma general, se utilizan para apli- 


caciones que no restringen la representación de datos en 8 bits. 
b) Codificación quoted-printable 


El mecanismo de codificación quoted-printable se utiliza para la 
representación y codificación en ASCII de 7 bits de datos, la mayoría de 
los cuales ya es de bytes representables en este formato. Es decir, este 
mecanismo se aplica cuando la información es mayoritariamente de ca- 


racteres de texto. Las normas básicas de codificación son las siguientes: 


un 


e Cualquier byte se puede representar con el carácter seguido 
por la notación hexadecimal en dos dígitos (y letras en mayúscula) 


del valor del byte. 


e Los bytes con valores decimales entre 33-60 y 62-126, incluídos los 


cuatro, se pueden representar con el carácter ASCII correspondiente. 


c) Codificación Base64 





El mecanismo de codificación Base 64 ofrece una codificación de in- 
formación binaria en ASCII de 7 bits que no deba ser legible. Los al- 


goritmos de codificación y descodificación son muy simples. 


El proceso de codificación se lleva a cabo tomando grupos de 3 bytes 
(24 bits). Manteniendo el orden de bits original, estos 24 bits se re- 
agrupan en 4 bloques de 6 bits (6 bits = 64 combinaciones). 


El fichero codificado se obtiene tomando cada uno de estos bloques 
de 6 bits y codificándolo como un carácter alfanumérico a partir del 


valor binario de los 6 bits, según la tabla siguiente: 


La codificación de datos en 
Baseé64 utiliza 4 caracteres 


para cada 3 bytes. Por este 
motivo, Base64 aumenta el 
tamaño de la información un 


33% (4/3). 








Tabla 14. 





Tabla de codificación Base64 











Nota 





Si debe codificarse un número de bytes que no sea 
múltiplo de 3 (la codificación, por tanto, no sería múl- 
tiplo de 4 bytes), se codifican todos los bytes y, al final 
de la cadena de caracteres ya codificada, se añaden 


“un 


tantos caracteres (carácter para rellenar, pad) 
como sean necesarios (máximo dos) hasta llegar a un 


número de caracteres múltiplo de 4. 








En el proceso de descodificación, se toman los caracteres alfanumé- 
ricos recibidos y se reconvierten en su valor binario correspondiente 
(6 bits) según la tabla. Cada 4 caracteres recibidos dan lugar a 24 
bits, y sólo es preciso irlos reagrupando en 3 bytes para generar el 
fichero descodificado. Antes de descodificar todo el mensaje, es pre- 


un 


ciso eliminar todos los caracteres que se encuentren al final. 


Identificador del contenido del mensaje (Content-ID) 





El campo de cabecera Content-ID se utiliza para proporcionar un 
identificador único al contenido del mensaje. Con dicho identifica- 


dor, se hace referencia al contenido de manera no ambigua. 


Content-ID: id-msg 
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Informador descriptivo del contenido 
(Content-Description) 


El campo Content-Description proporciona información des- 


criptiva del contenido en forma de texto. 


Content-Description: texto 


19.5.2. Extensiones para texto no ASCII 
en las cabeceras 


El MIME también permite codificar texto no ASCII en las cabeceras de 
los mensajes RFC 822 de manera no ambigua. Este método permite 
codificar toda la cabecera o sólo una parte. El texto (que puede ser 
de más de un carácter) ya codificado, precedido por el conjunto de 
caracteres y un identificador del tipo de codificación que se ha apli- 
cado, se incluye en el lugar correspondiente de la cabecera entre los 


caracteres “=?” y “?=":; 


=? charset ? codificación ? texto-codificado ?= 
charset = ISO-8859-(1 | ... | 9) | us-ASCII 


codificación = Q | B 








Nota 





a) Conjunto de caracteres (charset): es válido cualquiera 
de los caracteres permitidos en el Content-Type 


text/plain. 


b) Codificaciones: el formato MIME permite dos tipos 
de codificación similares a las codificaciones que 


se pueden aplicar al cuerpo del mensaje: 





e 0: es parecida al Content-Transfer-Encoding 
quoted-printable. Es la que se recomienda 
cuando la mayoría de los caracteres que deben 


codificarse son ASCII. 








e B: es idéntica al Content-Transfer-Encoding 


Base64. Es adecuada para el resto de casos. 








19.5.3. Mensajes multiparte 


En los mensajes multiparte, cada una de las partes suele estar for- 
mada por una pequeña cabecera y el contenido. En la cabecera se 


pueden encontrar los campos Content-Type, Content-Trans- 





fer-Encoding, Content-ID y Content-Description. Todos 


se refieren al contenido de la parte en cuestión. 


19.5.4. Ejemplo 


En este ejemplo se puede contemplar un mensaje RFC 822 con ex- 
tensiones MIME versión 1.0. Es un mensaje de dos partes: la prime- 


ra es de texto codificado con quoted-printable y la segunda es 





una imagen en formato .gif codificada en Base64. Asimismo, se 
puede ver un campo de cabecera con una letra í codificada con co- 


dificación Q. 


Date: 27 Jun 2003 0932 PDT 

From: Jordi Inyigo <jinyigo@uoc.edu> 

To: Ramon =?iso-8859-1?0?Mart=ED?= 
<rmarti@uoc.edu> 

MIME-Version: 1.0 









La “i" de Ramon Marti se ha 
codificado con codificación Q 





Content-Type: multipart/mixed; 
boundary="= 250699 " 


--= 250699 
Content-Type: text/plain; charset="iso-8859-1" 





Content-Transfer-Encoding: quoted-printable 
Esto es un mensaje RFC 822 que contiene MIME. 


--= 250699 
Content-Type: image/gif; name="Readme.gif" 





Content-Transfer-Encoding: base64 


RO 1GODLhIAAgAIAAAAAAAP/ / / yH5 BAEAAAAALAAAAAAGgACAAA 
AJz3 I+pywo0XoSywoaontzeRhnXKJYc82G0uaoL2brJ1x7pg+ 
eSzc9yHAHqhpmi8ddLspCT3Y2pXNZ+UxpUpGNNZVsYdBsMf 41 
BsMocuqLFyCHO516/MWY2sy7PL4F3+nU/kxcHePT191dnR+WS 
yAcimGVQAAA7 





--= 250699 -- 
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| 20. Servicio de noticias: el NNTP 


El servicio de noticias (en inglés, news) permite el envío de mensa- 
jes, como el servicio de correo electrónico, pero con la diferencia 
de que el originador no especifica el destinatario o destinatarios, 
sino que cualquier usuario con acceso al servicio puede leerlos. 
Esta funcionalidad, pues, se puede comparar a la de un tablón de 
anuncios, en el que todo el mundo puede leer los mensajes que se 


encuentran colgados. 


El servicio de noticias en Internet se conoce con el nombre Usenet, 
que proviene del de la red en que se desarrolló originariamente 
este servicio. En la actualidad, la distribución de noticias se ha ex- 
tendido por todo Internet, de manera que los anuncios enviados se 
pueden leer en cualquier parte del mundo. En la práctica, sin em- 
bargo, es posible restringir el ámbito en que se quiere distribuir los 
mensajes, puesto que algunos sólo serán interesantes, por ejemplo, 


en una determinada zona geográfica. 


| 20.1. El modelo NNTP 


En el servicio de noticias, la distribución de los mensajes o anuncios, 
que en Usenet se denominan artículos, se efectúa de manera des- 
centralizada. Teniendo en cuenta el enorme volumen de tráfico que 
genera este servicio, no sería viable tener un servidor central en el 
que todo el mundo dejara sus artículos y fuera a leer los de los de- 
más. Por este motivo, se utiliza un mecanismo de propagación en el 
que el autor de un artículo lo envía a un servidor de noticias, el cual 
se encargará de reenviarlo a una serie de servidores próximos o con 
los que esté conectado directamente, que a su vez lo reenviarán a 


otros servidores, y así sucesivamente. 


Con este mecanismo de propagación, se consigue que un artículo 


esté disponible para ser leído, idealmente, en todos los servidores de 
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Lectura complementaria 


Si queréis más información 
sobre el NNTP, consultad la 
obra siguiente: 

B. Kantor; P. Lapsley 
(1986, febrero). RFC 977 - 
Network News Transfer 
Protocol. 


Antiguamente se utilizaban 
otros métodos de transmi- 


sión de artículos entre servi- 
dores, como el UUCP (Unix 
to Unix copy protocol). 
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la red. Los usuarios que deseen leer los artículos podrán hacerlo, 
pues, conectándose a cualquier servidor, preferiblemente al que ten- 


gan más próximo. 


Por otro lado, los servidores sólo almacenan cada artículo durante 
cierto tiempo. Hay artículos que tienen una fecha de caducidad pre- 
determinada, y el servidor los borra automáticamente en la misma. 
Otros se borran, por ejemplo, cuando el servidor decide que los 
usuarios que puedan estar interesados en los mismos ya han tenido 


bastante tiempo para leerlos. 


El método utilizado para propagar los artículos tiene ciertas limi- 
taciones; por ejemplo, no se puede garantizar que un artículo lle- 
gue a todos los servidores en un plazo determinado (o, en ocasiones, 
que llegue a un servidor concreto), es preciso controlar el camino por 
donde pasa cada artículo para evitar bucles, etc. Sin embargo, 
este método es más práctico y eficiente que la solución de un solo 


servidor central. 


Los servidores de noticias se comunican entre sí para intercambiarse 
artículos por medio del NNTP (network news transfer protocol), espe- 
cificado en el documento RFC 977. 





Nota 





Un usuario que desee acceder al servicio, tanto 
para enviar artículos como para leerlos, puede ser 
que tenga acceso directo a alguno de los servidores 
de noticias. En este caso, la comunicación con el 
servidor es un asunto local. El caso más general, sin 
embargo, es que el usuario quiera acceder al servi- 
cio desde otro sistema, caso en que dicho sistema 
actuará como cliente. Entonces, la comunicación 
entre el cliente y el servidor se lleva a cabo también 
por medio del NNTP. 








Tanto si se trata de un cliente local, como de un cliente remoto, 
por norma general habrá otro proceso encargado de la interfaz 
con el usuario. Este tipo de programa se suele llamar lector de 


noticias. 


Asimismo, existe la posibilidad de que un grupo de clientes acceda a 
un servidor central de una organización por medio de un servidor es- 


clavo: 





Figura 88. 

















Nota 





El servidor esclavo puede mejorar la eficiencia en el 
acceso, por ejemplo, almacenando localmente copias 
de los últimos artículos leídos, por si los solicitan otros 


clientes. 


Los artículos disponibles en un servidor deben estar organizados en 
grupos, según su tema, para facilitar el acceso a los usuarios que 
quieran leerlos. Esta organización sigue un modelo jerárquico: en el 


nivel más alto de los grupos se encuentran los temas generales que, 
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Actualmente, existen otros 
grupos del nivel superior, 
como los que sólo contienen 
artículos destinados a una 


región geográfica. Por 
ejemplo eu para Europa, 
es para España, fr para 


Francia, etc. 
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en un segundo nivel, están divididos en subtemas, los cuales, a su 


vez, pueden estar subdivididos en niveles inferiores. 





Nota 





Es posible que un mismo artículo pertenezca a más de 
un grupo. Cuando un usuario envía un artículo al sis- 
tema de noticias, además de poder especificar en qué 
ámbito se debe distribuir, es preciso que indique obli- 


gatoriamente a qué grupo o grupos lo quiere enviar. 


La nomenclatura que se utiliza para designar los grupos consiste en con- 
catenar los nombres de cada nivel, de más alto a más bajo, separándo- 
los con “.” (por ejemplo, news .announce O comp.os.linux. hardware). 
En el nivel más alto de la jerarquía, los grupos originales de Use- 


net eran los siguientes: 


e Comp: temas relacionados con ordenadores e informática. 


* news: artículos sobre el sistema de noticias mismo. 


* rec: actividades recreativas, hobbies, etc. 


e soc: temas sociales, culturales, humanísticos, etc. 


* sci: temas científicos. 


e talk: debates, discusiones, opiniones, etc. 


e misc: otros temas no clasificables en los apartados anteriores. 


e alt: la jerarquía alternativa, que algunos aprovechan para sal- 


tarse las normas establecidas en los grupos “oficiales”. 


En la comunidad Usenet se han establecido una serie de reglas, ba- 
sadas en un sistema de votaciones, para decidir la creación de nue- 
vos grupos o la eliminación de alguno de los ya existentes. Este 
carácter de democracia asamblearia, y otros aspectos como la posi- 
bilidad de publicar escritos (fotografías, vídeos, etc.) o dar a conocer 


las ideas de una persona de manera global y casi instantánea (un 


sueño que, hasta la llegada de Internet, sólo estaba al alcance de los 
grandes medios de comunicación), hicieron de Usenet el gran fenó- 


meno sociológico de Internet durante unos cuantos años. 


Hoy día el servicio Usenet está eclipsado por la enorme popularidad 
del servicio WWW, que tiene una orientación mucho más comercial, 


pero no es tan participativo. 


| 20.2. Conceptos básicos del NNTP 


Por norma general, el NNTP utiliza el protocolo de transporte TCP. El 


número de puero asignado al servicio de noticias es el 119. 


En el NNTP, se utiliza un esquema de peticiones y respuestas como 
el del SMTP. Cada petición constituye una línea acabada con 


<CRLF> que contiene un comando, posiblemente con parámetros. 


Las respuestas también siguen la estructura general utilizada en el 
FTP o el SMTP. Cada respuesta se representa con una línea que em- 
pieza con un código numérico de tres dígitos. A continuación, según 
el código de respuesta, puede haber una serie de parámetros segui- 
dos de un texto arbitrario opcional, hasta el final de la línea, que 


acaba con <CRLF>. 


Los significados del primer dígito del código de respuesta son simi- 


lares a los del FTP y el SMTP; los del segundo son los siguientes: 


e x0x: respuesta referente a la conexión, inicialización, etc. 
e xlx: selección de un grupo de noticias. 

e x2x: selección de un artículo. 

e x3x: distribución de artículos. 

e x4x: envío de artículos. 

e x8x: extensiones no estándar. 


* x9x: mensajes informativos de prueba (debugging). 


Algunas respuestas van seguidas de un texto formado por una se- 
cuencia de lineas. En este caso, cada linea acaba con <CRLF>, y 
el final de la secuencia se indica con una línea en la que sólo se 


encuentra el carácter “.” antes de <CRLF>. Si alguna de las lí- 
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La especificaci6n NNTP es- 
tablece que las lineas de co- 
mandos no deben tener 


más de 512 caracteres. Por 
otro lado, los comandos y 
los parámetros se pueden 
escribir indistintamente en 
mayUsculas 0 minUsculas. 









Véase el anexo 4. 


Lectura complementaria 


Si queréis más información 
sobre el formato de los artí- 
culos Usenet, consultad la 
obra siguiente: 


M.R. Horton; R. Adams 
(1987, diciembre). RFC 1036 
- Standard for interchange of 
USENET messages. 
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neas de la respuesta debe empezar con “.”, el emisor inserta otro 


au 


- al principio de la línea y, por consiguiente, el receptor debe eli- 


un 


minar todos los iniciales que encuentre antes del final de la 


respuesta. 


Cuando el cliente establece la conexión, el servidor responde con un 
código 200 ó 201 para indicar que permite que el cliente envíe artí- 


culos o que no lo permite, respectivamente. 


| 20.3. Formato de los artículos 


El formato de los artículos Usenet está definido en la especificación 
RFC 1036, y se basa en el de los mensajes de correo electrónico (de- 
finido en la especificación 822), aunque con algunas restricciones 
adicionales. Por tanto, cada artículo consta de una cabecera forma- 
da por una serie de campos, y de un cuerpo separado de la misma 


por una línea en blanco. 


Hay seis campos obligatorios en la cabecera, que son los que se ex- 


ponen a continuación: 


* From: dirección de correo electrónico del originador del artículo 


(y, opcionalmente, también su nombre). 
* Date: día y hora en que se ha originado el artículo. 


e Newsgroups: lista de los grupos a los que se envía el artículo, 


separados por comas si hay más de uno. 


e Subject: asunto del que trata el artículo, que se utilizará como 


título. 


e Message-ID: identificador único del artículo. Aparte de este 
identificador único, para facilitar el acceso a los artículos, cada 
servidor les asigna un identificador local consistente en el nombre 
del grupo y un número correlativo dentro del grupo. Por lo tanto, 
si un artículo se ha enviado a diferentes grupos, tendrá más de un 
identificador. Dichos identificadores sólo son significativos para 
un servidor, puesto que otro servidor probablemente asignará 


identificadores locales diferentes a los mismos artículos. 


e Path: lista de servidores por los que ha pasado el artículo, sepa- 

rados con símbolos de puntuación que no sean “.” (por norma 
general, se utiliza el carácter “!”). Cada servidor debe añadir su 
nombre al principio de la lista. El valor de este campo permite que 
un servidor sepa si el artículo ya ha pasado por otro servidor y, 


por tanto, no es preciso volvérselo a enviar. 


Asimismo, la cabecera de un artículo puede incluir los campos op- 


cionales siguientes: 


e Reply-To: dirección a la que deben enviarse los mensajes de correo 


en respuesta al artículo (por defecto, la misma del campo From). 


e Sender: identificación del usuario que ha enviado el artículo al 


sistema de noticias, si no coincide con el del campo From. 


* Followup-To: lista de grupos de noticias, separados por comas, 
a los que deben enviarse los artículos de respuesta (por defecto, 


los mismos del campo Newsgroups). 





e Expires: fecha y hora en que el artículo se puede considerar ca- 
ducado y, por tanto, puede ser borrado por los servidores (en au- 


sencia de este campo, el servidor decide cuándo los borrará). 


* References: lista de identificadores de otros artículos a los que 


se hace referencia en el artículo. 


e Control: sirve para indicar que el artículo contiene un mensaje 
de control del sistema de noticias. El mensaje se especifica en el 
valor de este campo y sólo es interesante para los servidores (los 
usuarios no necesitan leer estos artículos). Los mensajes de con- 
trol sirven para cancelar artículos, crear y borrar grupos, informar 


de qué artículos tiene un servidor y cuáles pide otro, etc. 


e Distribution: lista de distribuciones a la que se debe enviar el 
artículo. Cada distribución es un conjunto de servidores que, por 
norma general, pertenecen a una misma área geográfica, una 


misma organización, etc. 


e Organization: nombre de la organización (empresa, institu- 


ción, etc.) a la que pertenece el originador del artículo. 


* Keywords: lista de palabras clave relacionadas con el contenido 


del artículo. 
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Summary: breve resumen del contenido del articulo. 


* Approved: algunos grupos de noticias son moderados, lo que sig- 


nifica que los usuarios no pueden enviar los artículos directamente. 
En este caso, los artículos deben enviarse por correo electrónico a 
una persona, llamada moderador del grupo, que es la única que 
está autorizada para poner artículos en el grupo. De la totalidad de 
mensajes que recibe, el moderador decide cuáles envía al grupo y 
cuáles no. Los mensajes que finalmente se envían deben llevar en el 


campo Approved la dirección de correo del moderador. 
Lines: número de líneas del cuerpo del artículo. 


Xref: este campo lo genera cada servidor y no debe transmitirse 
de un servidor a otro. Contiene el nombre del servidor y una lista 
de identificadores locales que tiene el mismo artículo en otros gru- 
pos a los que se haya enviado. Una vez que el usuario ha leído el 
artículo, este campo permite a los lectores de noticias marcarlo 


como leído en todos los grupos en que aparezca. 


La especificación RFC 1036 permite que la cabecera incluya otros 


campos no estándar. 





Ejemplo 


Ejemplo de artículo Usenet 





From: usuarilacme.com (Ernest Udiant) 

Path: News.uoc.es!news.rediris.es! 
news .eu.net!newsfeed.omninet. 
org!nntp.acme.com!usuari 

Newsgroups: soc.culture.espanol 

Subject: Nuevo libro de recetas tradi- 
cionales 

Message-ID: <KvjsSAam9Ly@acme.com> 

Date: Thu, 12 Dec 2002 09:12:30 GMT 

Expires: Sat, 19 Dec 2002 00:00:00 GMT 








T 


Organization: ACME Inc. 


Lines: 2 





La semana que viene se publicara un nuevo 
libro de recetas de cocina tradicional. 


Seguiremos informando... 





| 20.4. Comandos del NNTP 


A continuación, se detallan los comandos definidos en la especifica- 
ción RFC 977 del NNTP: 






Consultad la tabla de los 
códigos de respuesta al fi- 
nal de este subapartado. 






1) Listar grupos (LIST) 





Este comando sirve para obtener una lista de los grupos de noticias dis- 
ponibles. El servidor responde con un código 215 y, a continuación, en- 
u n 


vía una secuencia de líneas (acabada con “.”), una para cada grupo de 


noticias disponible, cada una con el formato siguiente: 


grupo último primero permiso 





Nota 





e grupo: nombre del grupo. 


e último: número correlativo (identificador local) 


del último artículo que hay en este grupo. 
* primero: número del primer artículo. 


* permiso: puede ser y o n para indicar si se pueden 








enviar artículos a este grupo, o no, respectivamente. 


LIST 


2) Seleccionar un grupo (GROUP) 


Este comando permite seleccionar un grupo concreto. El servidor en- 
vía una respuesta 211 con los parámetros siguientes (por este or- 
den): número estimado de artículos del grupo, número del primer 
artículo, número del último y nombre del grupo. Si el grupo no existe, 


la respuesta es 411. 





Nota 





El número de artículos que hay en el grupo no tiene 
por qué coincidir con la diferencia entre el número del 
último artículo y el anterior al primero, puesto que 


puede ser que se hayan borrado artículos intermedios. 


GROUP grup 
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3) Leer el articulo (ARTICLE) 


El parámetro puede ser un identificador Único de artículo o un núme- 
ro de artículo dentro del grupo actualmente seleccionado (el artículo 
leído pasa a ser considerado como el artículo actual). Sin parámetro, 
este comando lee el artículo actual. El servidor responde con un có- 
digo 220 seguido de dos parámetros: el número del artículo y su 
identificador Único. A continuación, envía el contenido del artículo 
(cabecera y cuerpo), acabado en “.”. Si hay algún error, el servidor 
responde con los códigos 412, 420, 423 o 430, según el caso. 


ARTICLE [ < identificador > | 
número] 


4) Leer la cabecera (HEAD) 





Este comando es idéntico a ARTICLE; sin embargo, el servidor sólo 
devuelve la cabecera del artículo. El código de respuesta será el 221 


en lugar del 220, con los mismos parámetros. 


HEAD [ < identificador > | 
número] 


5) Leer el cuerpo (BODY) 





Este comando es idéntico a ARTICLE; sin embargo, el servidor sólo 
devuelve el cuerpo del artículo. El código de respuesta será el 222 en 


lugar del 220, con los mismos parámetros. 


BODY [ < identificador > | 
número] 


6) Obtener el estatus (STAT) 





Este comando es idéntico a ARTICLE; sin embargo, el servidor no 
devuelve ningún texto, sino sólo la línea de respuesta. El código será 


el 223 en lugar del 220, con los mismos parámetros. 


STAT [ < identificador > | 
número] 


7) Seleccionar el artículo siguiente (NEXT) 


Este comando selecciona el artículo siguiente del grupo y hace que 


pase a ser considerado el artículo actual (es decir, lo que se leerá si 


m 


se envía el comando llamado ARTICLE sin parámetro). El código de 


T 





respuesta normal será el 223, como en el comando STAT. Un códi- 


go de error específico es el 421. 


NEXT 


8) Seleccionar el artículo anterior (LAST) 


Este comando selecciona el artículo anterior al actual. Los códigos de 





respuesta son como los del comando NEXT, pero cambiando el 421 
por el 422. 


| LAST | 


9) Listar grupos nuevos (NEWGROUPS) 





NEWGROUPS dispone de las mismas funciones que el comando 
LIST, excepto que el código de respuesta es 231 (en lugar de 215) 
y la lista de grupos está restringida a los que se han creado después 
de la fecha indicada por los parámetros (el primero son seis dígitos 
que representan año, mes y día, y el segundo, seis más que repre- 
sentan hora, minutos y segundos). Opcionalmente, se puede restrin- 
gir todavía más la lista especificando una o más jerarquías de alto 


nivel separadas por comas (por ejemplo, news, rec, etc.). 


NEWGROUPS aammdd hhmmss 
[GMT] [< jerarquias >] 


10) Listar artículos nuevos (NEWNEWS) 


El servidor responde a este comando con un código 230 y, a conti- 
nuación, envía una secuencia de líneas (acabada con “.”), una para 
cada artículo de los grupos especificados en el primer parámetro que 
se haya enviado o recibido después de la fecha indicada por el se- 
gundo y el tercero. Las líneas contienen los identificadores únicos de 


los artículos. 


NEWNEWS grups aammdd hhmmss 
[GMT] [< jerarquias >] 


El primer parámetro es un nombre de grupo o una lista de nombres 


separados por comas. En un nombre, puede aparecer el carácter es- 
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Un servidor no deberia ofre- 
cer a otro servidor articulos 
que ya le haya enviado antes 


© que ya hayan pasado por 
este Ultimo (el campo Path 
de la cabecera lo indica). 


Esta situación se conoce 
como doble ofrecimiento. 
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pecial “*”. En este caso, se considera que equivale a todos los nom- 


“x”, tengan una secuencia 


bres de grupos que, en lugar del 
cualquiera de caracteres, que puede incluir el separador “.” (Por 
ejemplo, alt.biz* puede equivaler a alt.biz.misc, alt.bi- 


“yu 


zarre, etc.). Por otro lado, si un nombre tiene el prefijo “!”, el grupo o 
grupos correspondientes se excluirán de la lista (por ejemplo, 
comp.lang.*, !comp.lang.c.* equivale a los grupos que em- 


piecen por comp.lang., pero no por comp.lang.c.). 


Opcionalmente, se puede restringir la lista de artículos a un conjunto 
de una o más jerarquías si se especifican en el último parámetro se- 
paradas por comas. La lista sólo contendrá artículos que pertenez- 


can al menos a un grupo de las jerarquías. 
11) Enviar un artículo (POST) 


Este comando se utiliza para enviar un artículo. El servidor responde 
con un código 440 para indicar que no se permite la operación, o 
con un 340 para solicitar el artículo. En el segundo caso, el cliente 
debe enviar el contenido del artículo (cabecera y cuerpo) con el for- 
mato definido en la especificación RFC 1036 y acabado con una línea 
en que sólo haya un ”.”. Entonces, el servidor enviará la respuesta de- 


finitiva, que será 240 o, si ha habido algún error, 441. 


POST 


12) Ofrecer un artículo (IHAVE) 


Cuando un servidor se conecta a otro, puede utilizar el comando 


THAVE para hacerle saber de qué artículos dispone. 


| IHAVE < identificador > | 


En cada artículo, el servidor receptor enviará en la respuesta un có- 
digo 335 si quiere recibir una copia del mismo o 435 si no le intere- 
sa. Si es preciso pasar el artículo, se hace por medio del comando 
POST, y el servidor receptor enviará en la respuesta un código 235 
o, en caso de error, uno 436. Asimismo, puede suceder que al re- 
ceptor no le interese el artículo después de examinar su contenido; 


en este caso, la respuesta será 437. 


13) Conexión desde un servidor esclavo (SLAVE) 


Este comando sirve para informar al servidor de que la conexión pro- 
viene de un servidor esclavo. El servidor puede decidir, por ejemplo, 
dar más prioridad a esta conexión que a las que provienen directa- 
mente de clientes porque se supone que atiende a más usuarios. El 


código de respuesta es el 202. 


SLAVE 


14) Mensaje de ayuda (HELP) 


Este comando se utiliza para obtener un mensaje de ayuda. El servi- 
dor responde con un código 100 y, a continuación, un texto informa- 
tivo de los comandos que acepta, acabado con una línea con un 


carácter “.”. 


HELP 


15) Cerrar la conexión (QUIT) 


Este comando se utiliza para cerrar la conexión. El servidor responde 


enviando un código 205 y cerrando la conexión. 


QUIT 


La especificación RFC 977 permite que las implementaciones aña- 
dan otros comandos a los estándares; sin embargo, recomienda que 
el nombre de estos nuevos comandos empiece con X para evitar po- 


sibles conflictos con posteriores extensiones oficiales. 


Algunos ejemplos de comandos implementados por muchos servido- 


res son los siguientes: 





* XGTITLE: confiere un título descriptivo de uno o más grupos. 





* XHDR y XOVER: dan, respectivamente, el valor de un campo y un 


resumen de la cabecera de uno o más artículos. 
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e XPAT: proporciona los valores de un campo de la cabecera que 
concuerdan con un patrón, junto con los números de los artículos 


correspondientes. 


La tabla siguiente resume los códigos de respuesta del protocolo NNTP: 





Tabla 15. 











Códigos de respuesta 





Mensaje de ayuda. 





Servidor preparado; se permite enviar artículos. 





Servidor preparado; no se permite enviar artículos. 





Conexión desde servidor esclavo. 


El servidor cierra la conexión. 





Grupo seleccionado. 





Lista de grupos. 





Contenido del artículo. 





Cabecera del artículo. 





Cuerpo del artículo. 





Identificador del artículo. 





Lista de artículos nuevos. 





Lista de grupos nuevos. 





Artículo recibido. 





Artículo enviado. 





Preparado para recibir un artículo de otro servidor. 





Preparado para recibir un artículo del cliente. 





Servicio no disponible. 





No existe el grupo. 





No hay ningún grupo seleccionado. 





No hay ningún artículo seleccionado. 


No hay artículo siguiente. 

















422 No hay artículo anterior. 

423 No hay ningún artículo con este número. 
430 No hay ningún artículo con este identificador. 
435 No se desea recibir el artículo. 

436 Error en la recepción del artículo. 
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Códigos de respuesta 





Artículo rechazado. 





No se permite enviar artículo. 





No se ha podido enviar el artículo. 





Comando desconocido. 





Error de sintaxis en el comando. 





Permiso denegado. 





Error interno. 














Actividad 


Estableced una conexión con un servidor NNTP (por 
ejemplo, con telnet servidor 119). Efectuad al- 
gunas operaciones como listar los grupos que haya 
(iatención: en algunos servidores la lista puede tener 
más de 10.000 líneas!), entrar en un grupo, ver la ca- 
becera de algún artículo, leer alguno entero, etc., y ob- 
servad los códigos numéricos de respuesta que envía el 


servidor. 
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| 21. Servicio hipermedia: WWW 


| 21.1. Documentos hipermedia 


El servicio WWW (world wide web) ofrece acceso a información mul- 
timedia, que puede incluir contenidos de diferentes tipos (texto, imáge- 
nes, audio, vídeo, etc.) y referencias a otros elementos de información, 


según el modelo de los sistemas hipertexto. 


Un sistema hipertexto permite recorrer un documento de manera no 
necesariamente lineal o secuencial, sino siguiendo las referencias o 
enlaces que el usuario selecciona y saltando a la parte referenciada. 
Es decir, en lugar de seguir un único camino lineal, se puede realizar 
un recorrido por el documento pasando por los arcos de un grafo. 
Esta manera de acceder a la información se suele llamar familiar- 


mente navegar. 





En la terminología WWW, cada uno de los elementos de información 
a los que se puede acceder se llama recurso. Los documentos hiper- 
media constituyen un caso particular de recurso que contiene infor- 
mación estructurada, posiblemente con diferentes tipos de contenido 


y enlaces a otros recursos. 


En la estructura de un documento, en general, se pueden distinguir 


los elementos siguientes: 


1) La estructura lógica, es decir, la división del contenido en partes 
que se encuentran en diferentes niveles, como capítulos, seccio- 
nes, apartados, subapartados, títulos, párrafos, figuras, tablas, 


encabezamientos, notas, etc. 
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SPDL esté basado en otro 
lenguaje muy popular que 


sirve para representar docu- 
mentos formateados: 
el lenguaje PostScript. 





DSSSL es la sigla de docu- 
ment style semantics and 


specification language, pu- 
blicado en el estándar ISO/ 
IEC 10179 
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2) La estructura física, es decir, la disposición de las partes del docu- 
mento en el medio de presentación (por norma general, papel o 
pantalla): la división del documento en páginas y grupos de páginas, 
la distribución del área de cada página en zonas para cabeceras y 


pies, los márgenes, los espacios reservados a figuras, tablas, etc. 


En el modelo general de procesado de los documentos estructura- 
dos, el autor crea la estructura lógica, con el contenido correspon- 
diente, y puede incluir ciertas directrices para controlar el aspecto 
visual que deberá tener el documento. En numerosas ocasiones, a un 
determinado conjunto de directrices de este tipo se le da el nombre 
de estilo. A partir de esta información, un proceso denominado de 


formateo se encarga de generar la estructura física. 


Existen diferentes representaciones normalizadas de los documen- 


tos estructurados, las cuales van destinadas a objetivos diferentes: 


a) Representaciones que se centran en la especificación de la es- 
tructura lógica, como el SGML (Standard Generalized Markup 


Language, publicado en el estándar internacional ISO 8879). 


b) Representaciones que se centran en la especificación de la estruc- 
tura física, como el SPDL (Standard Page Description Language, 
publicado en el estándar ISO/IEC 10180). 


c) Representaciones que comprenden tanto la estructura lógica 
como la física, por ejemplo el estándar ODA (Open Document 
Architecture, publicado en el estándar ISO/IEC 8613 y en la serie 
de recomendaciones ITU-T T.410). 


| 21.2. Marcado: el SGML 


El SGML contiene la especificación de un lenguaje que sólo permite 
representar la estructura de un documento desde el punto de vista ló- 
gico. En principio, un usuario puede aplicar los estilos que quiera 
para visualizar el documento. Sin embargo, lo más habitual es que 
las aplicaciones que utilizan este lenguaje proporcionen una serie de 
reglas para interpretar la estructura del documento y, en particular, 


para formatearlo. Por otro lado, se ha publicado otro estándar, lla- 


mado DSSSL, que permite definir estilos de presentación con las 
transformaciones necesarias para convertir un documento SGML en 


otra notación, como el SPDL. 


Un ejemplo de aplicación basada en SGML es el HTML (Hypertext 


Markup Language) diseñado para especificar documentos hipermedia. 





Nota 





Actualmente, la especificación oficial del HTML está 
bajo el control de un grupo de empresas y organizacio- 
nes conocido como World Wide Web Consortium 
(W3C). Con anterioridad, la responsabilidad era de un 
grupo de trabajo de la Internet Engineering Task Force 
(IETF), que cesó sus actividades en 1996 tras publicar el 
documento RFC 1866 con la especificación HTML 2.0. 





El SGML se publicó en 1986 con el objetivo de facilitar la especifica- 
ción de documentos estructurados. El lenguaje definido en este es- 
tándar, sin embargo, es lo suficientemente general para permitir la 
representación de muchos otros tipos de información estructurada 


(bases de datos, etc.). 


| 21.3. Transferencia de hipermedia: el HTTP 


El HTTP (hipertext transfer protocol) es la base del servicio WWW. Sus 
orígenes fueron los trabajos de un grupo de investigadores del CERN 
(Centro Europeo de Investigación Nuclear) que, al final de los años 
ochenta y principios de los noventa, definieron un protocolo para ac- 
ceder de manera sencilla y cómoda a la información distribuida en 
las diferentes sedes del centro. Cuando el conjunto de sistemas ac- 
cesibles con este mecanismo se extendió a otras organizaciones y 
países de todo el mundo, nació lo que hoy conocemos como WWW 


(World Wide Web). 


De la misma manera que el HTML, el HTTP también evoluciona constan- 
temente a medida que los implementadores incorporan nuevas funcio- 
nalidades para adaptarlo a diferentes tipos de aplicaciones particulares. 


En 1996, se publicó el documento RFC 1945, en que se define la versión 
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Lectura complementaria 





Podéis ampliar la informa- 
ción sobre el SGML en la 
obra siguiente: 


Charles Goldfarb (1990). 
The SGML Handbook. 
Oxford: Oxford University 
Press. 


La definición de URI constituye 
otro ejemplo de especifica- 


ción en constante evolución, 
al menos hasta que se pu- 
blicó el documento RFC 
2396, en 1998. 
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HTTP/1.0 (este documento también contiene las especificaciones de la 
denominada versión 0.9 para facilitar la interoperabilidad con imple- 
mentaciones antiguas). Sin embargo, el año siguiente ya se publicó la es- 
pecificación HTTP/1.1 en el documento RFC 2068. 


A continuación, veremos las características principales de la funciona- 
lidad que ofrece el HTTP. Sin embargo, antes de entrar en los detalles 
del protocolo, estudiaremos el método general utilizado en el servicio 


WWW para identificar la información a la que se quiere acceder. 


21.3.1. Direccionamiento: identificadores uniformes 


de recurso (URI) 


Desde un documento se pueden referenciar recursos especificando 
sus direcciones, que se representan por medio de lo que en la termi- 


nología WWW se denomina identificador uniforme de recurso o URI. 


La forma general de un URI se puede expresar del modo siguiente: 


esquema: identificador 


Ésta es la forma correspondiente a un URI absoluto. La palabra que 
se encuentra antes del separador “:” es el esquema, que determina 
la sintaxis del identificador. Esta sintaxis también puede permitir la 
especificación de URI relativos, en que se omite el esquema y el se- 


no $.” 


parador “: 


Un URI puede ser un localizador (URL), si especifica cómo se accede 
al recurso, y/o un nombre (URN) si identifica el recurso por medio 


de un conjunto de atributos: 


ftp://[usuario[:contraseña]@] servidor/camino 


Según el esquema, éstas son algunas sintaxis posibles de los URL: 
a) ftp 


Este tipo de URL identifica un recurso accesible por medio del 


protocolo FTP: servidor es el nombre del ordenador servidor 


y camino es el nombre completo de un fichero o directorio. Si el 
nombre de usuario no se encuentra presente, significa que es pre- 
ciso utilizar anonymous y, como contraseña, cualquier cadena de 


caracteres. 


b) news 


Este URL identifica un conjunto de artículos si identificador es el 
nombre de un grupo de noticias Usenet, en el caso de que sólo sea 
un identificador de mensaje (campo Message-ID), entonces sólo 


identificará un determinado artículo: 


news: identificador 


c) mailto 


Este identificador URL representa una dirección de correo electrónico: 


mailto: dirección 


d) telnet 


Este URL representa un servicio accesible por medio del protocolo Te- 


Inet en el servidor y el puerto especificados: 


telnet://[usuario[:contrasefia]@]servidor[:puerto] [/] 


e) http 


Cuando deba accederse al recurso identificado por medio del HTTP, 


se utilizará un URL de acuerdo con la sintaxis siguiente: 


URL-HTTP = URL-HTTP-absoluto | URL-HTTP-relativo 
URL-HTTP-absoluto = http: //servidor[:puerto 
[camino-absoluto] 

URL-HTTP-relativo = camino-absoluto | camino-relativo 
camino-absoluto = /camino-relativo 

camino-relativo = [camino] *(;parámetro) [? consulta] 


[+ fragmento] 


camino = segmento *(/segmento) 
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segmento, parámetro, 
consulta o fragmento 


pueden ser una cadena 


vacia. 
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En esta sintaxis, servidor es el nombre del ordenador con que 
es preciso establecer la conexión HTTP para acceder al recurso, y 
puerto es el número de puerto en que debe efectuarse la co- 
nexión que, por defecto, es el número asignado al servicio WWW, 


es decir, el 80. 


Cada uno de los segmentos que forman el camino se asocia, por 
norma general, a un nombre de directorio o de fichero. Estos nom- 
bres no pueden incluir los caracteres “/",%7",%2", M1, “4,000, 42", 
“>” o espacio. El carácter “/” sí que puede estar presente en un pa- 


n 1“ 9 n 


rámetro, y tanto “/” como “;” y también pueden estar presentes 


en los componentes consulta y fragmento. 


Si en el camino aparece el carácter “3”, debe ir seguido de dos dí- 
gitos hexadecimales, y esta secuencia de tres caracteres equivale al 
carácter que tenga el código indicado por los dígitos. Por tanto, se 
puede utilizar una secuencia “2HH” para representar cualquiera de 
los caracteres no permitidos en un URL, incluyendo el mismo carácter 


Mol 


+" (que se representaria con “%25"). 





Nota 





A continuación, presentamos diferentes ejemplos de URL 
con esquemas diferentes (lo dos últimos son URL HTTP 


relativos): 


ftp://ftp.uoc.es/pub/doc/README 
news:comp.infosystems.www.misc 
mailto:Ernest.Udiant@campus.uoc.edu 
http://www.uoc.es/ 

http://www.acme.com/%7Eadmin/ 

http: //www.acme.com/buscador/busca.cgi?nom=Internet 
http://www.acme.com/doc/ayuda.html#buscador 
/doc/ayuda.html#buscador 








ayuda. html#buscador 


Los URL relativos se pueden utilizar en documentos HTML, en concre- 


to en los atributos que representan direcciones de otros recursos 





(HREF, SRC, ACTION). Estos URL se consideran relativos a una deter- 








minada dirección base, que es la indicada por el elemento BASE del 





documento o, si este elemento no se encuentra presente, la dirección 


que se ha utilizado para acceder al mismo documento HTML. 


Para obtener el correspondiente URL absoluto, es preciso aplicar las 


reglas siguientes: 


1) Si el URL relativo contiene un camino absoluto, sustituye al camino 


de la dirección base. 


2) Si el URL relativo contiene un camino relativo (y el camino no está va- 
cío), se sustituye el último segmento de la dirección base (la parte del 
camino que se encuentre después del último “/”) por éste. Como 
caso especial, cada segmento con nombre ”. .” que se encuentre en 
el inicio del camino relativo debe suprimirse junto con el último seg- 


mento que quede al final del camino de la dirección base. 


3) Si el camino del URL relativo está vacío, pero hay alguno de los 
otros componentes (parámetros, consulta, fragmento), se toma el 
camino de la dirección base y se sustituyen los componentes co- 


rrespondientes por los del mismo. 





Nota 





Interpretación del URL relativo 


Dada la dirección base http: //www.uoc.edu/extern/ 
ct/home/home.html, los URL relativos siguientes debe- 


rían interpretarse de este modo: 














Tabla 16. 
URL relativo URL absoluto 
/accesset98/ http://www.uoc.edu/accesset98/ 





otras/pagina.html | http://www.uoc.edu/extern/ct/home/otras/pagina.html 





../../logo.jpeg http://www.uoc.edu/extern/logo. jpeg 





#final http://www.uoc.edu/extern/ct/home/home.html#final 














21.3.2. Conceptos bdsicos del HTTP 


El HTTP sigue el modelo general de peticiones y respuestas entre un 
cliente y un servidor. Se basa en un servicio de transporte fiable; pero, 
es independiente del mecanismo de transporte concreto utilizado. No 


obstante, lo más habitual es que cliente y servidor se comuniquen por 
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Si el URL relativo esta com- 
pletamente vacío, se toma 
directamente toda la direc- 
cién base, incluyendo el 


fragmento, si hay (en los 


otros casos, el fragmento de 
la dirección base no se con- 
sidera). 
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medio del TCP. En este caso, el puerto por defecto para establecer las 


conexiones es el asignado oficialmente al servicio WWW, es decir, el 80. 


En el HTTP/1.0, el cliente establece una conexión con el servidor y le 
envía un mensaje HTTP con la petición; y, a continuación, el servidor 
envía al cliente otro mensaje HTTP con la respuesta y cierra la co- 
nexión. Si quiere efectuar más peticiones, el cliente debe establecer 
una nueva conexión para cada una. En el HTTP/1.1, en cambio, es 
posible intercambiar diferentes peticiones y respuestas en una misma 
conexión que se denomina conexión persistente. Éste es el modo de 


funcionamiento por defecto en el HTTP/1.1. 


Un mensaje HTTP consta de una primera linea, en la que hay infor- 
mación específica del protocolo, seguida de un mensaje con el mis- 
mo formato que los mensajes de correo electrónico, según la 
especificación RFC 822. Es decir, después de la primera línea debe 
haber una cabecera formada por una serie de campos, una línea en 
blanco y un cuerpo. En casos particulares, la cabecera y/o el cuerpo 
pueden estar vacíos, pero la línea en blanco que los separa siempre 


debe estar presente. 


El cuerpo del mensaje, junto con los campos de la cabecera que pro- 
porcionan información sobre su contenido, forman lo que en el HTTP 


se denomina una entidad. Cada entidad corresponde a un recurso. 


Dependiendo de si el mensaje HTTP es una petición o una respuesta, 
la primera línea recibe el nombre de línea de petición o línea de es- 


tatus, respectivamente. 


La sintaxis de una línea de petición es la siguiente: 


método <SP> URI <SP> versión <CRLF> 


En esta línea, método especifica qué tipo de operación (o, en la ter- 
minología HTTP, qué método) solicita el cliente, URI identifica el re- 
curso a que se debe aplicar la operación y versión debe ser la 
cadena HTTP/1.0 o HTTP/1.1, según la versión del protocolo. El 
URI debe ser un URL HTTP relativo que contenga un camino absolu- 
to; es decir, que empiece por “/” (excepto cuando el servidor sea un 


proxy, como veremos más adelante). 








Nota 








Siempre que un usuario quiera utilizar un cliente 
para obtener el recurso dado por la dirección 
http://www.acme.com:8000/doc/principal.html, 
el cliente debe conectarse al puerto 8000 del servi- 
dor www.acme.com y enviarle una petición que em- 


piece con esta línea: 


GET /doc/principal.html HTTP/1.0 





En este caso, el método utilizado es GET (obtener re- 
curso). Ahora bien, si la dirección fuera http: // 
www.acme.com:8000/, la linea que debería enviar- 


se sería simplemente la siguiente: 


GET / HTTP/1.0 





La sintaxis de las líneas de estatus es la siguiente: 


versión <SP> código <SP> frase <CRLF> 


La cadena versión es igual que en la línea de petición, el código 


es un número de tres dígitos, el primero de los cuales indica de qué 


tipo de respuesta se trata, y frase es un texto explicativo en formato 


libre, inteligible para los usuarios humanos. 


Los posibles códigos de una respuesta HTTP/1.0 son los siguientes: 








Tabla 17. | 





Significado 


Operación efectuada. 





Se ha creado un nuevo recurso. 





Petición aceptada. 





La respuesta está vacía. 

















301 El recurso solicitado ha cambiado de dirección. 

302 El recurso solicitado ha cambiado temporalmente de dirección. 
304 El contenido del recurso no ha cambiado. 

400 Petición incorrecta. 

401 Usuario no autorizado. 
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En el HTTP, el significado 
del primer dígito del código 
de respuesta varía un poco 
de lo que se considera co- 
mún (que encontraréis en el 


anexo 4) y es el siguiente: 


* 1: Información. 
IA 

¢ 3: Redireccionamiento. 
e 4: Error en el cliente. 


e 5: Error en el servidor. 





Consultad los servidores in- 


termediarios en el apartado 
21.3.4 de esta unidad. 
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Significado 


Acceso prohibido. 





No se ha encontrado el recurso. 





Error interno del servidor. 





Operación no implementada. 





Error en otro servidor. 





Servicio no disponible en la actualidad. 











Nota 
En el HTTP/1.1 se han añadido a esta lista hasta 22 


nuevos códigos de respuesta. No obstante, si un clien- 





te recibe un código xyz que no conoce, debe interpre- 
tarlo como si fuera x00. En este sentido, el código 100 
significa ‘continuar’ y el cédigo 300 quiere decir ‘re- 


curso accesible en una dirección o más”. 





Almacenamiento local de respuestas (memoria caché) 


Para optimizar el tráfico de la red, es habitual que los clientes HTTP 
guarden una copia de las respuestas que reciben de los servidores, junto 
con el URL que han utilizado en la petición. El almacén destinado a este 
fin recibe el nombre de memoria caché. Si el usuario quiere volver a ac- 
ceder a un recurso que ya había solicitado previamente, el cliente puede 
utilizar la copia de la memoria caché en lugar de volver a enviar la mis- 


ma petición al servidor. 


El cliente puede decidir, o el usuario puede configurar, el tiempo que 
se guardarán los elementos de la memoria caché, su dimensión 
máxima o la política que deberá seguirse para borrar sus elementos 
cuando esté llena. Asimismo, el HTTP también proporciona directri- 
ces para determinar qué recursos se pueden guardar en la memoria 
caché y cuáles no, o cuánto tiempo se puede guardar como máximo 


un determinado recurso. 


Sin embargo, no sólo los clientes pueden guardar copias de las res- 
puestas obtenidas de los servidores; también pueden hacerlo los ser- 


vidores intermediarios o proxies. 


Cabeceras de los mensajes HTTP 


Los campos que puede haber en la cabecera de un mensaje HTTP se 


pueden clasificar en cuatro grupos: 


1) Campos generales que pueden estar presentes tanto en los men- 


sajes de petición, como en los de respuesta. 


2) Campos referentes a la entidad contenida en el cuerpo del men- 
saje y que también pueden estar presentes en peticiones y res- 


puestas. 
3) Campos propios de las peticiones. 


4) Campos propios de las respuestas. 


El HTTP proporciona un mecanismo de extensión que permite incluir 
campos no estándar en las cabeceras. Si una implementación no re- 
conoce un determinado campo, lo que debe hacer es simplemente 
ignorarlo (o retransmitirlo tal como lo encuentra si es un servidor in- 


termediario). 


Los campos que puede contener la cabecera son los siguientes: 


1) Campos generales definidos en HTTP/1.0: 


a) Date: fecha. Indica la fecha y la hora en que se originó el men- 
saje. Los valores de los campos HTTP que representan fechas se 
deben expresar de una de estas tres maneras, siempre referidas 
al tiempo universal (TU, anteriormente conocido como hora del 


meridiano de Greenwich o GMT): 


Fri, 06 Dec 2002 09:22:15 GMT (REC 1123, forma recomendada) 
Friday, 06-Dec-2002 09:22:15 GMT (RFC 850) 
Fri Dec 6 09:22:15 2002 (formato ANSI C) 


b) Pragma: lfdirectriz. Este campo sirve para proporcionar 
una lista de directrices a los sistemas que intervienen en la trans- 
ferencia (clientes o servidores). La semántica de las directrices 
depende de las implementaciones; sin embargo, hay una defi- 
nida por el protocolo, que se representa con la palabra no-ca- 


che. Si un mensaje de petición contiene esta directriz, significa 
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que debe enviarse la petición al servidor correspondiente aun- 
que exista una copia de la respuesta guardada en la memoria 


caché. 





Nota 





La especificación HTTP/1.1 añade cinco nuevos cam- 


pos generales: 


e Cache-Control: directrices sobre la política de 


memoria caché. 


e Connection: opciones de conexión. La opción 
close indica que el emisor cerrará la conexión 


después de que se haya enviado la respuesta. 





* Transfer-Encoding: codificación aplicada al 


cuerpo del mensaje. 
e Upgrade: versiones del protocolo soportadas. 


e via: intermediarios por los que ha pasado el men- 


saje. 








2) Campos referentes a la entidad definidos en el HTTP/1.0: 


a) 


b) 










Consultad los nuevos cam- 
pos de cabeceras en el 
subapartado 19.5.1. 
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Content-Length: 1*dígito. Indica la longitud en bytes del 
cuerpo de la entidad. Si este campo no está presente en una res- 
puesta, el cliente sólo puede saber cuál es el final del cuerpo 
cuando el servidor cierra la conexión. En un mensaje de petición 
que incluya un cuerpo, el campo Content-Length es obligato- 
rio, puesto que de otro modo el servidor no podría enviar la res- 


puesta y no se podría cerrar la conexión. 


Content-Type: tipo. Indica el tipo de contenido del cuerpo de 


la entidad (por ejemplo, text/html si es un documento HTML). 





E 


El valor de este campo se representa según la especificación MIMI 
y, por tanto, puede incluir parámetros (por ejemplo, char- 
set=1S0-8859-1 si los caracteres están codificados según el al- 
fabeto latín1). Todos los mensajes HTTP con cuerpo deberían 


incluir el campo Content-Type. 


c) Content-Encoding: codificación. Indica si se ha aplicado 
alguna transformación al contenido de la entidad (por ejemplo: 


x-gzip). El valor de este campo se representa según la especifi- 





cación MIME. 


d) Last-Modified: fecha. Indica la fecha y la hora en que el re- 


curso contenido en el cuerpo se modificó por última vez. 


e) Expires: fecha. Indica la fecha y la hora a partir de la cual 
el contenido del cuerpo se puede considerar obsoleto o cadu- 
cado al efecto de su almacenamiento en la memoria caché. La 
presencia de este campo significa que, posiblemente, el recur- 
so se modificará en la fecha indicada o dejará de existir; sin 
embargo, no implica que los cambios, si se producen, deban 
efectuarse necesariamente en esta fecha. Ahora bien, si la fe- 
cha de caducidad es igual o anterior a la especificada en el 
campo Date, la entidad no debe almacenarse en la memoria 


caché. 


f) Allow: 1fmétodo. Indica los métodos HTTP que se pueden 


aplicar al recurso solicitado. 





Nota 





La especificación HTTP/1.1 añade seis nuevos campos 


de entidad adicionales: 





e Content-Base: dirección base para interpretar 


URL relativos. 
* Content-Language: lenguaje que se ha utilizado. 


* Content-Location: URI de la entidad, en caso 
de que el recurso correspondiente disponga de 


más de una. 


* Content-MD5: secuencia de bits para comprobar 


la integridad del contenido. 


* Content-Range: por si una entidad se envía en 


diferentes fragmentos. 





e ETag: etiqueta asociada a la entidad, por si el re- 


curso dispone de mds de una. 
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3) 


a) 


b) 


Ejemplos de listas de pro- 

ductos: 

eyn: 2 relz 
libwww-FM/2.14. 


NCSA Mosaic/2.6 
(Cab sun®s) 44 
sun4m) libwww/2.12. 


Harvest/1.5.17. 





d) 


e) 


Consultad la codificación 


en Baseé4 en el apartado 
125.11. 
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Campos propios de las peticiones HTTP/1.0: 


From: dirección. Este campo contiene la dirección de co- 


rreo electrónico del usuario que solicita el recurso. 


User-Agent: l1*implementación. Este campo permite 
identificar la implementación del cliente. Se expresa como una 
lista de “productos” (por ejemplo, tipo de navegador, librerías 
de soporte que utiliza, etc.) con números de versión opcionales 
(separados de los nombres con “/”), que puede incluir comen- 
tarios entre paréntesis. El servidor puede utilizar esta informa- 
ción para generar estadísticas, detectar qué implementaciones 
producen ciertos errores, adaptar las respuestas al tipo de 


cliente, etc. 


Referer: URI. Si el usuario selecciona un enlace de un do- 
cumento HTML o de otro recurso que tiene dirección propia, el 
cliente puede incluirla en el campo Referer del mensaje de 
petición. El servidor puede utilizar esta información para gene- 
rar estadísticas, detectar desde qué recurso se referencia una 


dirección incorrecta u obsoleta, etc. 


If-Modified-Since: fecha. Cuando el cliente ya dispone 


de una copia del recurso solicitado en la memoria caché, pue- 





de utilizar este campo para llevar a cabo una operación GET 
condicional: si el recurso se ha modificado con posterioridad a 
la fecha indicada, se efectuará la operación de manera normal 


y, si no, el servidor enviará una respuesta sin cuerpo y con el 





código 304. Este campo sólo es aplicable al método GET. 


Authorization: esquemafparámetro. Con este campo, 
un usuario puede presentar sus credenciales a un servidor (por 
norma general, un nombre y una contraseña) para que le per- 
mita acceder a recursos no públicos, es decir, de acceso res- 
tringido. La primera parte de la credencial indica el esquema 
de autenticación a utilizar. El HTTP/1.0 sólo define un esquema 
denominado básico, pero se puede utilizar cualquiera mientras 


sea conocido por el cliente y el servidor. Si se utiliza el esquema 





básico, el valor de este campo debe ser la palabra Basic se- 


guida de la cadena de caracteres que resulta de codificar en 





Base64 el nombre de usuario y su contraseña separados por ”:”. 





Ejemplo 


Si el nombre de usuario es webmaster y su contra- 





seña es Secret, se codificará en Base64 la cadena 
webmaster:Secret. El campo quedaría de este 


modo: 


Authorization:Basic d2VibWFzdGVy01N1Y3J1dA== 


Obviamente, la descodificación de este campo es trivial 
y, por tanto, no hay protección contra terceros que ten- 
gan la posibilidad de inspeccionar los mensajes y de- 
seen obtener un acceso no autorizado. Para conseguir 
que el método de autenticación sea más seguro, se 
puede utilizar un esquema más sofisticado o alguna 
variante del protocolo basada en el cifrado de los da- 


tos, por ejemplo el HTTPS. 





La respuesta a una petición que incluya el campo Authorization 


no debería guardarse en la memoria caché. 





Nota 





En la especificación HTTP/1.1 se añaden los campos 


de petición siguientes: 


e Accept: tipo de contenido que el cliente puede 


aceptar. 


e Accept-Charset. 


e Accept-Encoding. 





e Accept-Language. 


* Host: nombre del servidor a quien va dirigida la 
petición, por si tiene más de uno; este campo, 
obligatorio en las peticiones HTTP/1.1, permite 
que un ordenador con diferentes nombres actúe 
como si fuera diferentes servidores al mismo 


tiempo. 
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4) 


a) 


b) 








e If-Match: permite comparar entidades por sus 


etiquetas. 
e If-None-Match. 
e If-Range. 
e If-Unmodified-Since. 
e Max-Forwards. 
e Proxy-Authorization. 


* Range: sirve para solicitar un fragmento de una 
entidad. 








Campos propios de las respuestas HTTP/1.0: 


Server: 1*implementación. Este campo es similar a User- 


Agent, pero referido al servidor. 


Location: URI. Indica que el recurso solicitado debe obtenerse 
en otra dirección. Éste será el caso cuando el código de respuesta 
sea 301 ó 302. Por norma general, cuando el cliente reciba una 
respuesta que incluya este campo, generará de manera automá- 


tica una nueva petición con la dirección indicada. 


WWW-Authenticate: 1#(esquema realm = "reino" *( , 
parámetro )). Este campo es obligatorio cuando el código de 
las respuestas es 401. Indica que es necesario presentar una cre- 
dencial para acceder al recurso solicitado, o que la que se ha pre- 


sentado no es válida. 


Un servidor puede agrupar sus recursos de acceso restringido en 


reinos, cada uno con su esquema de autenticación y conjunto de 


usuarios autorizados (con una misma credencial debería poderse 


acceder a todos los recursos de un reino). El valor de este campo 


es una lista con los nombres de los reinos aplicables al recurso soli- 


citado, junto con sus esquemas y parámetros opcionales para poder 


llevar a cabo la autenticación con el campo Authorization de la 


petición. 





Nota 





En la es 


e Age. 


de la 








pecificación HTTP/1.1 se añaden los campos 


de respuesta siguientes: 


e Proxy-Authenticate. 


e Public: lista de métodos soportados por el ser- 


vidor. 
e Retry-After. 


e vary: lista de campos de la petición que se han 
utilizado para seleccionar una entidad, cuando el 


recurso dispone de más de una. 


* Warning: información adicional sobre el estatus 


respuesta. 


21.3.3. Métodos del servicio HTTP 


El protocolo HTTP/1.0 define los tres métodos siguientes: 


1) Método GET. Este método sirve para obtener la entidad corres- 


2) 


pondiente al URI especificado en la línea de petición. Por norma 


general, el servidor traducirá el camino del URI a un nombre de 


fichero o de programa: 


e Enel primer caso, el cuerpo de la entidad será el contenido del 


fichero. 


e En el segundo caso, el servidor ejecutará el programa y la en- 


tidad será e 


| resultado que genere. 


Los componentes parámetro y/o consulta del URI se pueden 


utilizar como a 


rgumentos del programa. 


Método HEAD. Este método es igual que el GET, excepto que en 


la respuesta el cuerpo estará vacío y, por tanto, sólo tendrá cabe- 


cera (que deberá ser idéntica a la que se habría enviado si el mé- 


todo fuera el G! 





ET). Por norma general, se utiliza el método H] 





aN 
EA 
BAI 





D, 
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Cuando el camino de un URI 
identifica un programa, la 
manera como se le pasan 
los valores de los paráme- 
tros o las consultas es un 
asunto local del servidor. Por 


ejemplo, un mecanismo uti- 
lizado habitualmente es el 
denominado CGI (Common 
Gateway Interface). 
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3) 


por ejemplo, para comprobar si un URL es válido o para obtener 
información sobre un recurso sin necesidad de transferir su con- 


tenido. 


Método POST. Este método sirve para enviar una entidad que 
el servidor debe incorporar al recurso identificado por el URI 
de la línea de petición. La semántica de este método depende 
del tipo de recurso de que se trate. Por ejemplo, se puede uti- 
lizar para añadir contenido a un recurso existente, para enviar 
un mensaje a un tablón de anuncios o un grupo de noticias, 
para crear un nuevo registro en una base de datos, para pasar 
datos a un programa que debe ejecutarse en el servidor, etc. 
Un caso típico de este último ejemplo son los datos de un for- 
mulario HTML. 


El código de respuesta a una operación POST por norma general 
será 201, si como resultado, se ha creado un nuevo recurso (en este 
caso, el cuerpo de la respuesta debería contener una referencia a 
este recurso), o bien 200 ó 204 si no se ha creado ninguno (el cuer- 
po de una respuesta 200 contendrá una descripción del resultado 


obtenido, y el de una respuesta 204 simplemente estará vacío). 


Una propiedad del método POST es que, si se envían dos peticiones 
iguales, el resultado de la segunda no debe ser necesariamente el 
mismo que el de la primera. Por tanto, la respuesta a una operación 


POST no debería guardarse en la memoria caché. 





Nota 





En el HTTP/1.1 se han añadido una serie de métodos 


nuevos, entre lo cuales, los siguientes: 


e PUT: para crear un recurso con el URI especificado 


en la petición. 














° DELETE: para borrar un recurso. 





e OPTIONS: para obtener información sobre las op- 


ciones de transferencia. 





e TRACE: para obtener una copia del mensaje como 


ha llegado a su destino final. 











Actividad 


Estableced una conexión con un servidor HTTP con telnet 
servidor 80 y averiguad la fecha en que ha sido 
modificada por última vez la página principal, o algu- 


na otra información referida al servidor (con un men- 





saje formado por la línea HEAD / HTTP/1.0, una 


cabecera vacía, una línea en blanco y un cuerpo vacío). 





21.3.4. Intermediarios: proxies y pasarelas 


El modelo general del HTTP no sólo considera la conexión directa 
de un cliente con el servidor, sino también la conexión por medio 


de servidores intermediarios, como es el caso de los proxies: 





Figura 88. 











Conexión directa 


CE eh eects aa ie 


Conexión a través de servidores intermediarios 


Capa EA | — Aa 1TP/1.0% Servidor 





En la configuración con proxy, el cliente establece la conexión con 
el servidor proxy que, a su vez, establece otra conexión, como 
cliente, con el servidor final. Cuando el proxy recibe el mensaje de 
petición del cliente, puede generar una respuesta propia o retrans- 
mitirla al servidor final. En el segundo caso, el proxy puede intro- 
ducir modificaciones en la petición, según la aplicación para la 
que esté diseñado, y, cuando reciba la respuesta del servidor final, 
la retransmitirá al cliente, también con la posibilidad de efectuar 


cambios. 


Asimismo, es posible que haya más de un proxy en la cadena; es de- 
cir, que el primer proxy no se conecte directamente al servidor final, 


sino por medio de otro proxy, y así sucesivamente. 
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En las peticiones que un cliente (u otro proxy) envia a un proxy, existe 


una variación respecto al caso de la conexión directa de cliente a ser- 


vidor: el URI de la línea de petición no debe ser un URL HTTP relativo, 


sino que debe ser un URI absoluto. De lo contrario, el proxy no sabría 


cuál es el servidor final al que va destinada la petición. 


El uso de un servidor proxy tiene diferentes aplicaciones. Las princi- 


pales son las siguientes: 


a) 


b) 


c) 


Actuar como cortafuegos que aísle una red local del resto de las 
redes. En esta configuración, los clientes no tienen acceso directo 
al exterior de su red, y toda comunicación con los servidores re- 
motos tiene lugar por medio del proxy. Ello permite minimizar el 
riesgo de que usuarios externos comprometan la seguridad de los 


sistemas locales (accesos no autorizados, sabotajes, etc.). 


Tener una memoria caché compartida entre los usuarios de la red 
local. Si diferentes clientes solicitan directamente un mismo recurso, 
por norma general guardarán la misma copia de la respuesta en sus 
respectivas memorias caché. Si lo solicitan por medio de un proxy, la 
primera petición necesitará un acceso al servidor remoto; sin embar- 
go, las siguientes quizá puedan aprovechar la copia ya guardada en 


la memoria caché, aunque provengan de clientes diferentes. 


Construir una jerarquía de memorias caché de proxies: en el nivel 
más bajo se encuentran los proxies a que acceden directamente 
los clientes, en un segundo nivel existen los proxies a que acce- 
den los del primer nivel, etc. Incluso puede haber proxies a escala de 
todo un país. Hay un protocolo denominado ICP (Internet cache 
protocol) que permite coordinar los diferentes servidores proxy de 


una jerarquía. 





Nota 





Además de los proxies, existe otro tipo de servidor inter- 
mediario llamado pasarela. Las pasarelas actúan como 
si fueran el servidor final, con la diferencia respecto al 
proxy de que el cliente no sabe que no se conecta direc- 
tamente al servidor final. Una pasarela se puede utilizar 
como cortafuegos en la red del servidor o para traducir 
las peticiones HTTP de manera que se pueda acceder a 


recursos almacenados en sistemas no HTTP. 








| 22. Mensajería instantánea 


No cabe duda de que Internet ha cambiado la manera de comuni- 
carnos. Para muchos de nosotros, el correo electrónico ha reempla- 
zado casi por completo al correo tradicional y ha hecho disminuir de 
forma considerable las llamadas telefónicas que realizamos. Diaria- 


mente se envían millones de correos electrónicos. 


A pesar de lo rápido que es el sistema de correo, aún no lo es bastan- 
te. En algunos servidores, se pueden acumular retardos de algunos 
minutos. Además, por rápido que sea, se trata de un sistema asíncro- 
no, que no permite mantener una conversación fluida. Cada mensaje 
enviado o recibido implica una serie de pasos a seguir, botones a pul- 
sar y ventanas a abrir. Por todo ello, se han popularizado los sistemas 


de mensajería instantánea, un clásico del modelo peer-to-peer. 


Las aplicaciones de mensajería instantánea permiten mantener una 
lista de personas (las buddy lists o listas de contactos) con las que uno 
desea mantenerse en contacto y mandarles mensajes, siempre y 
cuando estén concetados. Este detalle no nos debe preocupar, por- 


que es la propia aplicación la que se encarga de verificarlo. 


La manera de mandar mensajes es muy simple. La aplicación nos 
presenta una ventana en la que tecleamos el contenido del mensaje 
y donde se verá lo que nos conteste el interlocutor. De esta manera, 


se puede mantener una conversación en tiempo real. 


Además de la conversación básica, la mayoría de programas de men- 


sajería instantánea ofrecen otras prestaciones, como las siguientes: 


+ Chat que permite establecer conversaciones en grupo. 


e Pizarra que permite ver dibujos realizados por el interlocutor, en 


el momento o grabados en archivos. 


e Archivos que permite compartir archivos. 
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Algunos sistemas permiten 
el uso de cámaras de vídeo, 


micrófonos y altavoces para 
que la conversacién no se 
circunscriba sélo a texto es- 
crito. 





La dirección de la web 
de ICQ es la siguiente: 


http://www.icq.com. 
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Desde que en 1983 apareció el primer sistema de mensajería instan- 
tánea, han salido al mercado otros muchos productos, algunos 
usando protocolos propietarios, otros intentando buscar un están- 
dar. De hecho, la IETF ha recopilado muchas de estas contribuciones 
y está desarrollando el Instant Messaging and Presence Protocol, por 


el cual se espera que pase el futuro de la mensajería instantánea. 





Nota 





En general, el honor de haber creado el primer siste- 
ma de mensajería instantánea se atribuye a Mirabilis, 
la compañía formada por cuatro estudiantes israelíes 
que en 1996 lanzó ICQ. Pero no debemos olvidar que 
en los sistemas Unix existe desde 1983 una aplicación lla- 
mada talk que permite la conversación entre dos usua- 
rios conectados a sendos sistemas Unix via telnet o 


rlogin 


Seguramente, la proliferación de los ordenadores 
domésticos, Internet y la web de finales de los noven- 
ta, mayoritariamente en entorno Windows, ha eclip- 
sado un tanto todo lo que tenía que ver con el 


entorno Unix. 








| 22.1. Programas de mensajería instantánea 


Sin pretender crear una lista exhaustiva, vamos a repasar los princi- 
pales programas que proporcionan la funcionalidad de la mensajería 
instantánea en un entorno peer-to-peer. Algunos de los programas 


presentados son de software libre, pero otros no. 


22.1.1. ICQ 


ICQ fue el primer programa que apareció (en 1996) y actualmente 
aún es de los más populares. Las siglas responden a la frase "I seek 
you", ('te estoy buscando”). ICQ usa control centralizado a través de 
servidores, y la comunicación entre clientes y servidores, y entre clien- 


tes se realiza mediante un protocolo propietario (ICQ, v.5). 


22.1.2. AIM 


AIM (AOL Instant Messenger), que apareció poco después de ICQ, 
es la evolución de las comunidades que America OnLine ya tenia de- 
sarrolladas con otras tecnologias mds antiguas, como las BBS (Bulle- 
tin Board System). AIM también usa un protocolo propietario. Por 


tanto, el cliente tiene que ser especifico para este entorno. 





Nota 
En 1998, AOL compró Mirabilis e integró ICQ en su 


suite de servicios ofrecidos. 





22.1.3. MSN Messenger 


Microsoft también ha entrado en el mundo de los sistemas de men- 
sajería instantánea con MSN (Microsoft Network) Messenger. Es muy 


parecido a los dos descritos anteriormente. 


22.1.4. Jabber 


Jabber es más que un mero sistema de mensajería. Es un conjunto 
de protocolos y tecnologías que permiten el desarrollo de múltiples 
aplicaciones peer-to-peer. Permite desarrollar clientes, servidores, 
componentes, bibliotecas, etc. Está basado en XML y es la base de 


los protocolos que la IETF está en proceso de estandarización. 


Sus autores presentan entre las ventajas de Jabber las siguientes: 
permite entornos descentralizados, es abierto, público, seguro, ex- 


tensible y flexible. 


22.1.5. GAIM 


Gaim es un cliente de mensajería instantánea multiprotocolo, para 
GNU/Linux, Unix BSD, MacOS X y Windows. Es compatible con AIM, 
ICQ, MSN Messenger, Yahoo, IRC, Jabber, Gadu-Gadu y Zephyr. 


Una de sus mejores prestaciones es que permite estar conectado con 


diferentes redes de mensajería simultáneamente. Así, un usuario de 


La dirección de la web de 


AIM es la siguiente: 


http://www.aim.com. 





La dirección de la web de 
MSN Messenger es la si- 
guiente: 


http://messenger.msn.com 


La dirección de la web de 
Jabber es la siguiente: 


http://www. jabber.org. 





La dirección de la web de 


GAIM es la siguiente: 


http://gaim.sourceforge.net. 





321 


Gaim puede estar en un chat de AOL mientras está conversando con 
un amigo de Yahoo y dentro de un canal IRC, todo en la misma apli- 


cación. 


| Resumen 


En este curso hemos presentado las bases de funcionamiento de la 


red Internet. 


En la primera parte se han presentado los conceptos básicos de re- 
des de computadores y los diferentes sistemas de comunicaciones 
que se utilizan hoy día, siguiendo un hilo conductor histórico, que 
permite entender el porqué de muchas de las limitaciones y particu- 
laridades que poseen. Se ha expuesto, también, la arquitectura de 
protocolos, un concepto básico en redes de computadores. Como 
paradigma de dicho concepto, se ha explicado el modelo de referen- 
cia OSI y se han descrito los siete niveles que lo forman. Las arqui- 
tecturas reales, en particular Internet, suelen describirse y explicarse 


en relación con el modelo OSI. 


En la segunda parte hemos hecho un repaso, desde un punto de vista 
descriptivo, a las redes de área local. El principio básico de funcio- 
namiento de las redes de área local es la difusión de tramas en un 
medio compartido. Así, las estaciones de la red, cuando quieran es- 
tablecer una comunicación con otra (u otras) estaciones, deberán ge- 
nerar tramas de bytes a partir de los datos que quieran transferir. Y 


ponerlas en el medio para que lleguen a su o sus destinatarios. 


Se han presentado las topologías más usuales, destacando las topo- 
logías en bus y en anillo. En un bus, todas las estaciones se conectan 
a un mismo cable, mientras que en un anillo, cada estación está co- 
nectada a dos más, creando una estructura circular. Ambas topolo- 
gías tienen ventajas e inconvenientes, siendo el más importante de 
estos la dificultad de mantenimiento y localización de averías que 
presentan ambas. Esto ha propiciado el desarrollo del cableado es- 
tructurado, como mecanismo para instalar redes de área local más 


fiables y siguiendo estándares universales. 


Asociados al cableado estructurado han aparecido dispositivos muy 


comunes hoy en día como son los concentradores y los conmutado- 
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res. Los primeros simulan un bus y los segundos aprovechan el con- 
cepto de conmutación para conseguir redes más eficientes. Siempre 
que se puede, las tramas no se difunden a todas las estaciones pre- 


sentes en la red, si no sólo a sus destinatarias. 


Finalmente se han presentado las políticas de acceso al medio más 
habituales, las cuales van asociadas a la topología usada. Así, he- 
mos visto la política de paso de testigo como la más adecuada para 
las redes en anillo, y la CSMA/CD, que se usa en la mayoría de las 
redes en bus, tanto si es un bus cableado como a través de un con- 


centrador. 


En la tercera parte, se han descrito de los protocolos que se utilizan 
en la red Internet. En concreto, se han visto los protocolos del nivel 
de interconexión de red, que son IP y sus asociados ARP e ICMP, y los 


protocolos del nivel de transporte: TCP y UDP. 


Se ha visto el fenómeno del encapsulamiento de la información, 
como resultado de tener diferentes protocolos involucrados en una 


misma conexión, y como este encapsulamiento afecta al nivel de red. 


Uno de los aspectos más relevantes del protocolo IP es la asignación 
de direcciones. Hemos visto como cada interfaz conectada a Internet 
debe tener una dirección IP Única que la identifique. Las direcciones 
IP no sólo identifican estaciones, sino también la red o subred donde 
está la estación. De este modo, es posible encaminar los paquetes IP 
a través de diferentes encaminadores y, por lo tanto, a través de di- 


ferentes redes. 


El protocolo ICMP nos permite resolver incidencias que puedan ocu- 
rrir en la Red. Hemos descrito las peculiaridades de este protocolo, 
así como dos utilidades como son el ping y el traceroute, de uso 


muy habitual. 


Hemos descrito las redes de acceso a Internet más habituales, 
como son la red Ethernet, el acceso mediante una conexión tele- 
fónica con el protocolo PPP y el acceso mediante el protocolo 
ADSL, que permite usar el cable telefónico pero sin tener que es- 


tablecer una llamada. 


Por lo que respecta al nivel de transporte, hemos visto como su prin- 
cipal objetivo es entregar la información a los niveles orientados a la 
aplicación en los extremos de la red. En la jerarquía de protocolos 


TCP/IP se definen dos protocolos de transporte: 


1) El UDP, que es un protocolo no orientado a la conexión. Por tanto, 
no efectúa ningún control de errores ni de flujo. Si un datagrama 
UDP llega equivocado (el UDP utiliza un código detector de erro- 
res), el UDP lo descarta y no lo entrega a la aplicación. Esta última 
deberá ser capaz de responder a este tipo de servicio o deberá 
asumir la pérdida de la información. Este tipo de servicio puede 
ser Útil en aplicaciones en tiempo real, en las que es más impor- 
tante que la información llegue cuando le toca; es decir, con un 


retardo limitado, que no que se pierda una parte de la misma. 


2) El TCP, que es un protocolo orientado a la conexión. Habrá una 
fase de establecimiento de la conexión (el llamado procedimiento 
three-way handshake), una fase de transmisión de la información 
y una fase de finalización de la conexión. El TCP entregará la in- 
formación a la aplicación totalmente libre de errores. Para conse- 
guirlo, necesita efectuar un control de errores y de flujo. El TCP 
utiliza un código detector de errores junto con un protocolo de re- 
transmisiones para recuperar la información errónea. Como las 
memorias intermedias de recepción se pueden desbordar, el TCP 
utiliza un control de flujo por ventana deslizante. El TCP debe 


dimensionar correctamente los temporizadores de retransmisión. 


En la cuarta y última parte, se ha presentado el concepto de progra- 
mación distribuida y el modelo cliente/servidor, que es el más utili- 
zado. También se ha presentado el modelo peer-to-peer, que no es 
una alternativa al anterior como a veces se ha planteado, porque no 
es un modelo de programación de aplicaciones, sinó que hace refe- 


rencia al tipo de máquinas que se interconectan. 


También se ha descrito el servicio de nombres de dominio, que pro- 
porciona acceso a una base de datos distribuida por toda la Red que 
permite obtener información sobre un determinado nombre. Las 
consultas más habituales son para averiguar la dirección IP que co- 
rresponde a un nombre de servidor, pero también es posible obtener 
el nombre del servidor de correo de un dominio dado, el nombre de 


una máquina a partir de su dirección IP, etc. 
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Por lo que respecta a las propias aplicaciones, en esta unidad se han 


presentado los llamados servicios básicos de Internet, que son: 


e Telnet: protocolo general para establecer sesiones interactivas 
con un servidor que permite que el cliente actúe como un terminal 


virtual. 


e  rlogin: protocolo de terminal virtual con facilidades para simplifi- 


car el proceso de identificación del usuario. 


e rsh, rexec: protocolos para la ejecución remota de procesos en el 


servidor. 


Se han presentado también los protocolos más usados quizás hoy en 
día, como son la transferencia de archivos, el correo electrónico, el 
servicio de news, el WWW y la mensajería electrónica, con sus múl- 


tiples posibilidades. 


Sobre el FTP, se ha comentado que permite copiar archivos del clien- 
te al servidor, del servidor al cliente y también de un servidor a otro, 
y que proporciona operaciones para que el cliente pueda manipular 


el sistema de archivos del servidor. 


Sobre el correo electrónico, que es un servicio basado en los mismos 
conceptos del correo postal, se ha comentado en concreto la filosofía 


de almacenamiento y reenvío. 


La norma RFC 822 especifica el formato de los mensajes, y la norma 
MIME especifica un conjunto de extensiones para, por ejemplo, ad- 


juntar archivos y usar diversos idiomas. 


Tres protocolos proporcionan las diferentes funcionalidades necesa- 


rias: 


e SMTP: transferencia de mensajes. 


* POP3: acceso simple a buzones de correo. 


e |IMAP4revl: acceso complejo a buzones de correo. 


El servicio de noticias (news) facilita la publicación de mensajes con 
un alcance que puede ir desde el ámbito local de una organización, 
hasta el ámbito mundial (toda la Internet). Se basa en la propaga- 
ción de los mensajes entre los diferentes servidores por medio del 
NNTP. Este mismo protocolo puede ser utilizado por los clientes para 
acceder a los mensajes guardados en un servidor o para enviar otros 


nuevos. 


El servicio WWW permite “navegar” por un conjunto de elementos 
de información interconectados con referencias o enlaces entre sí 
que pueden contener datos con diferentes tipos de representaciones 
(texto, imágenes, audio, vídeo). El protocolo que proporciona el ac- 


ceso a esta información es el HTTP. 


El servicio de mensajería instantánea está soportado por diferentes 
protocolos, algunos propietarios. Existen diferentes plataformas que 
lo proporcionan y también se han desarrollado diferentes clientes 
multiprotocolo que permiten acceder a diferentes redes de mensaje- 


ría simultáneamente. 
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| Anexos 


| Anexo 1 


El algoritmo checksum 


Los protocolos IP y TCP utilizan, entre otros, un sencillo checksum para 


la detección de errores. Esta es una versión del algoritmo checksum: 


u short checksum(u_short * addr,int len) 
{ 

int aux_len = len; 

u_short *aux_addr = addr; 

u_short res; 


int sum = 0; 


while (aux len > 1) 
{ 

sumt = *aux addr++; 
aux len= = 2} 


} 


if (aux len == 1) 


sumt = *(u char) *aux addr; 

sum = (sum>>16) + (sum & Oxffff); 
sum+ = (sum>>16); 

res = ~sum; 


return res; 
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| Anexo 2 


Aplicaciones mencionadas en el texto 


1) Aplicaciones estándar 


A continuación, resumimos las aplicaciones estándar que se han vis- 


to en el cursoy que están disponibles en entornos Unix y GNU/Linux. 
En los sistemas Unix podréis 


encontrar más información 


utilizando el comando man. 


i y e ping: por medio de paquetes ICMP (del tipo petición de eco y res- 
Por ejemplo, para saber mds 


delalles del feomendo route puesta de eco) permite saber si una máquina está funcionando o 


de Unix podéis ejecutar: no y tener una idea de cuál es el retardo de ida y vuelta (round-trip). 
$ man route 





Asimismo, permite saber por qué máquinas pasa el paquete hasta 
que llega a destino. Para esta función, va mejor el programa tra- 


ceroute, a causa de las limitaciones inherentes a los paquetes 


ICMP. 


e traceroute: permite averiguar la ruta que se sigue desde el 


equipo local hasta un destino cualquiera de Internet. Marca los 
Para ejecutar los comandos . . 
retardos existentes en cada uno de los nodos que es preciso cru- 


que se muestran en este 
anexo se requiere tener pri- zar. Se basa en el campo TTL del paquete IP y los mensajes ICMP- 
vilegios de superusuario. 





time-to-live-exceeded. Esta aplicación no está disponible en algu- 
nas distribuciones de Unix y distribuciones de GNU/Linux, pero se 


puede conseguir facilmente. 


e arp: permite consultar y modificar la tabla ARP (caché ARP) de 


una máquina. 


e route: sirve para consultar y modificar la tabla de direcciona- 


miento IP de una máquina conectada a Internet. 


e ifconfig: permite consultar el estado de las tarjetas de red dis- 


ponibles en el sistema local. 


e netstat: proporciona estadísticas de los protocolos TCP y UDP. 
Permite listar los puertos que se escuchan. Muestra el estado en 
que se encuentran los sockets TCP. Si queréis un listado de todos 
los sockets activos y puertos abiertos, haced netstat -a, y, si os 


interesan otras variantes, consultad la ayuda. 


e telnet: ofrece, aporte de la principal emulación de terminal, co- 


nectar y experimentar los protocolos ASCII. 
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2) Aplicaciones no estandar 


* netcat (licencia GPL-Lenguage C): esta aplicación nos permite 
utilizar conexiones TCP y UDP desde la línea de comandos (por 
ejemplo, transmitir un fichero) o comprobar qué puertos tiene 


abiertos una determinada máquina, entre otros servicios. 


* tcpdump [Unix (software libre-lenguaje C)]: permite analizar el trá- 
fico de la red por medio de conexión (LAN o punto a punto). Al con- 
trario de lo que su nombre indica, es capaz de interpretar los 
paquetes no sólo en el ámbito TCP, sino también en el IP, red, y 
aplicación (para aplicaciones comunes). Es una herramienta im- 
prescindible para cualquier administrador de sistemas, aunque no 
aparezca en las distribuciones de las diferentes variantes de Unix. 
El código es de libre distribución. Sus autores son Van Jacobson, 
Craig Leres y Steven McCanne, de la Universidad de California, 
aunque el programa en que se basaba el original, el Etherfind, era 


propiedad de Sun Microsystems y se distribuía dentro de SunOS. 





Nota 





En LAN, el tcpdump pone la tarjeta de red en modo 
promiscuo. Lo que significa que todo el tráfico de la 
red es visible, con lo que cualquier usuario malinten- 
cionado (un hacker) puede hacer un mal uso del mis- 
mo. Por tanto, el tcpdump y otras herramientas 
similares o derivadas del tcpdump, conocidas como 
detectores (sniffers) se pueden considerar como una 
herramienta potencialmente peligrosa. De hecho, lo 
que es arriesgado es no utilizar al menos uno de los 
tres mecanismos de protección más importantes con- 


tra los detectores: cifrado, cifrado y cifrado. 








A continuación, se indican los resultados que puede mostrar el pro- 


grama tcpdump. 


3) El programa tcpdump 


El programa tcpdump permite capturar y filtrar paquetes que cruzan 


una interfaz de red que se ha activado en modo promiscuo (todos los 
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paquetes que pasan por el medio son capturados y filtrados). Los pa- 
quetes son procesados por un software especial que sólo puede eje- 


cutar el superusuario (roof) de la máquina. 


Para ver cómo funcionan los diferentes protocolos, proporcionamos 
ejemplos de las trazas que muestra el tcpdump durante el estable- 


cimiento o la terminación de la conexión. 


Para ver cómo funciona este comando, puede utilizarse la instrucción 
man de Unix (o GNU/Linux). En este anexo ofrecemos un ejemplo del 


significado de la traza del tcpdump. 


El formato general de salida del tcpdump es el siguiente: 


Data src> dst: flag data-sqno ack window urgent options 


El significado de los componentes del formato son los siguientes: 


e data: este componente nos proporciona la hora en que se pro- 
dujo el acontecimiento en formato hora:minutos:segundos.micro- 


segundos (o milisegundos, según la resolución del reloj). 


e srce y dst: son las direcciones IP y los puertos TCP/UDP de las 


conexiones de fuente y de destino. 


e flags: son una combinación de los posibles indicadores de un 
segmento/datagrama TCP/UDP: S (SYN), F (FIN), P (PUSH), R 
(RST) y ‘.’ (que significa que no hay indicadores). 


* data-sqno: describe el número de secuencia de la porción de datos. 


e ack: es el número de secuencia del byte siguiente que espera re- 
cibir el otro extremo TCP/UDP. 


e window: es el tamaño de la ventana que el receptor advierte al 


transmisor. 


e urgent: indica que existen datos urgentes en este segmento/da- 


tagrama. 


* options: son las opciones TCP que suelen estar entre corchetes 
del tipo < >; por ejemplo, el tamaño máximo del segmento (por 


ejemplo, <mss 1.024>). 


Supongamos que hacemos un rlogin desde la mdquina argos 
(fuente) hasta la máquina helios (destino). Un ejemplo de una linea 


que retorna el comando tcpdump sería el siguiente: 


e 12:34:23.165439 argos.1023 > helios.login: S 7838437: 
7838437 (0) win 4096 <mss 1024> 


e 12:34:23.165439 helios.login > argos.1023: S 453534: 
453534 (0) ack7838438 win 4096 <mss 1024> 


La primera línea indica lo siguiente: 


a) El acontecimiento tiene lugar a las 12:34:23.165439. 


b) Su origen es la máquina argos con el puerto 1.024. Su destino es 


la máquina helios con el puerto login. 


c) El indicador S señala que es un segmento de SYN (por ejemplo, 


por un inicio de conexión). 


d) Advierte un número de secuencia 7.838.437 y consume hasta este 
número. Conviene observar que el tcpdump escribe el número ini- 
cial y el final del número de secuencia de datos, y, entre paréntesis, 
la diferencia indicando la longitud del campo de datos (en este caso 
O bytes, puesto que es un segmento de petición de conexión). Por 
tanto, indica entre paréntesis la longitud del segmento de datos. Este 
número de secuencia es absoluto. Las salidas siguientes del tcp- 
dump indicarán los números de secuecia relativos al inicial. Por ejem- 
plo, en lugar de indicar 7.838.437: 7.838.450, (13) en notación 
absoluta, indicará 1:13, (13) en notación relativa al ISN (se cumple 
que valor absoluto es igual al ISN más el valor relativo). Lo mismo se 


aplica a los números de secuencia del ACK. 


e) Advierte una ventana de 4.096 bytes. 


f) Hay una petición de tamaño máximo de segmento de 1.024 bytes. 


La segunda línea indica lo siguiente: 


a) El origen es la máquina helios con el puerto 1ogin. El destino es 


la máquina argos con el puerto 1.023. 
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b 


=~ 


El indicador S señala que es un segmento de SYN (por ejemplo, 


para un inicio de conexión). 


c) Indica el número de secuencia inicial 453.534. 


d 


= 


Reconoce con un ACK el byte siguiente que espera del transmisor, 
el 7.838.438 (es decir, 7.838.437 + 1), puesto que los recibió co- 
rrectamente hasta el 7.838.437). 


— 


e) Advierte una ventana de 4.096 bytes. 


f) Hay una petición de tamaño máximo de segmento de 1.024 bytes. 


El programa tcpdump permite escuchar, de manera sencilla, todo lo 
que sucede en la red. Admite toda una serie de indicadores para filtrar 
sólo las direcciones IP de fuente o de destino que pueden interesar, o el 
tipo de protocolo que se quiere escuchar (TCP, UDP, ARP, etc.). Asimis- 
mo, admite indicadores para obtener el campo de datos, para filtrar un 
número fijo de segmentos, etc. Para ver todas las posibles opciones que 


permite el programa tcpdump se utiliza el comando man. 


| Anexo 3 


Notación 


En este anexo se detalla la notación que se utiliza en toda la unidad 
para describir los campos de los mensajes y los comandos soporta- 
dos por los diferentes protocolos. 


Cadena literal 


Las cadenas literales se definirán con letra de espaciado fijo. 


Variable 


Las variables se definirán con letra inclinada de espaciado fijo o letra 


cursiva. 


variable 


Alternativa 


Para indicar que en una especificación se debe elegir un elemento 
de una lista de n elementos, se utiliza el carácter “|” para separar las 


diferentes alternativas. 


elementol | elemento2 | ... | elementon 


Repeticion 


Para los elementos que se pueden repetir entre n y m veces, se utiliza la 
construcción n*m como prefijo. Los valores n y m se pueden suprimir. En 


este caso, se toman por defecto los valores n = O y m = vacío. 


n*melemento 
n*elemento 


*melemento 


*elemento 
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Opcional 


Para indicar que una cadena o una variable son opcionales, es pre- 


“i n 


ciso cerrarlas entre los caracteres “[” y 


| te1emento] | 


Repeticion especifica 


Cuando se quiere indicar que un elemento debe aparecer con exactitud 


un número entero n de veces, debe ponerse el número n como prefijo. 


nelemento 


Lista 


Si se quiere especificar una lista de entre n y m elementos separados 














por comas, se utiliza la construcción nim como prefijo. Los valores n 
y m se pueden suprimir. En este caso se toman los valores por defec- 


to, que son n= 0 y m = vacío. 


Agrupamiento 


Cuando se quiere que uno o más elementos sean tratados como un 
Unico elemento a efectos de los operadores |, * y +, se indica ce- 


n 


rrándolos con los caracteres ” (” y ”) ”. Se suele utilizar en especifica- 


ciones de repeticiones y listas. 


(elementol elemento2 ... elementon) 


Caracteres especiales 


Algunos caracteres especiales se incluyen entre los caracteres “<” y “>”. 


<CR>: retorno de carro (CR, carriage return) 


<LF>: salto de línea (LF, line feed) 
<CRLF>: retorno de carro + salto de línea 








| Anexo 4 


Códigos de respuesta 


Las diferentes RFC definen los códigos de respuesta posibles para 
cada uno de sus comandos, así como su significado. Estos códigos 
están formados por tres dígitos y, para facilitar su interpretación, lle- 


van asociado un significado concreto para cada dígito. 
Primer dígito 


Indica si la operación se ha efectuado o no. 





Tabla 18. 











Primer dígito 


Respuesta preliminar: se ha iniciado la operación y, cuando se 
haya completado, el servidor enviará una nueva respuesta. 


Operación completada correctamente. 


Respuesta intermedia: la operación se ha aceptado; sin 
embargo, el cliente debe enviar nuevos comandos con más 
información para completarla. 





Respuesta negativa temporal: no se puede llevar a cabo la 
operación, pero se podrá efectuar si el cliente lo reintenta. 


Respuesta negativa definitiva: no se puede efectuar la 
operación y probablemente tampoco se podrá llevar a cabo si 
el cliente lo reintenta. 





Segundo dígito 


Indica el tipo de respuesta. 





Tabla 19. 








Segundo dígito 


Error de sintaxis, comando no implementado o, en general, 
respuesta no perteneciente a ninguna de las otras categorías. 





Respuesta informativa. 


Respuesta referente a las conexiones. 





Respuesta referente al proceso de autenticación (nombre de 
usuario, contraseña, etc.). 





Respuesta referente a la aplicación concreta (por ejemplo, al 
sistema de ficheros o de correo). 
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Cuando se quiere leer un fi- 
chero con acceso temporal- 
mente bloqueado porque 
otro proceso estd escribien- 
do datos en el mismo, el 
servidor envia una respues- 


ta negativa temporal. En 
cambio, cuando se quiere 
leer un fichero que no exis- 
te, el servidor envia una res- 
puesta negativa definitiva, 
aunque siempre existe la 
posibilidad de que mientras 
tanto otro proceso lo cree. 





Tercer digito 


El tercer digito complementa la informacién del segundo digito para 


especificar de qué respuesta concreta se trata. 
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| GNU Free Documentation License 


GNU Free Documentation License 
Version 1.2, November 2002 


Copyright (C) 2000,2001,2002 Free Software Foundation, Inc. 
59 Temple Place, Suite 330, Boston, MA 02111-1307 USA 
Everyone is permitted to copy and distribute verbatim copies 


of this license document, but changing it is not allowed. 


0. PREAMBLE 


The purpose of this License is to make a manual, textbook, or other 
functional and useful document "free" in the sense of freedom: to 
assure everyone the effective freedom to copy and redistribute it, 
with or without modifying it, either commercially or noncommercially. 
Secondarily, this License preserves for the author and publisher a way 
to get credit for their work, while not being considered responsible 


for modifications made by others. 


This License is a kind of "copyleft", which means thot derivative 
works of the document must themselves be free in the same sense. It 
complements the GNU General Public License, which is a copyleft 


license designed for free software. 


We have designed this License in order to use it for manuals for free 
software, because free software needs free documentation: a free 
program should come with manuals providing the same freedoms 
that the software does. But this License is not limited to software 
manuals; it can be used for any textual work, regardless of subject 
matter or whether it is published as a printed book. We recommend 
this License principally for works whose purpose is instruction 


or reference. 
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1. APPLICABILITY AND DEFINITIONS 


This License applies to any manual or other work, in any medium, 
that contains a notice placed by the copyright holder saying it can be 
distributed under the terms of this License. Such a notice grants a 
world-wide, royalty-free license, unlimited in duration, to use that 
work under the conditions stated herein. The "Document", below, 
refers to any such manual or work. Any member of the public is a 
licensee, and is addressed as "you". You accept the license if you 
copy, modify or distribute the work in a way requiring permission 


under copyright law. 


A "Modified Version" of the Document means any work containing the 
Document or a portion of it, either copied verbatim, or with 


modifications and/or translated into another language. 


A "Secondary Section" is a named appendix or a front-matter section 
of the Document that deals exclusively with the relationship of the 
publishers or authors of the Document to the Document's overall 
subject (or to related matters) and contains nothing that could fall 
directly within that overall subject. (Thus, if the Document is in part a 
textbook of mathematics, a Secondary Section may not explain any 
mathematics.) The relationship could be a matter of historical 
connection with the subject or with related matters, or of legal, 


commercial, philosophical, ethical or political position regarding them. 


The "Invariant Sections" are certain Secondary Sections whose titles 
are designated, as being those of Invariant Sections, in the notice that 
says that the Document is released under this License. If a section 
does not fit the above definition of Secondary then it is not allowed to 
be designated as Invariant. The Document may contain zero 
Invariant Sections. If the Document does not identify any Invariant 


Sections then there are none. 


The "Cover Texts" are certain short passages of text that are listed, 
as Front-Cover Texts or Back-Cover Texts, in the notice that says 
that the Document is released under this License. A Front-Cover 
Text may be at most 5 words, and a Back-Cover Text may be at 


most 25 words. 


A "Transparent" copy of the Document means a machine-readable 
copy, represented in a format whose specification is available to the 
general public, that is suitable for revising the document 
straightforwardly with generic text editors or (for images composed of 
pixels) generic paint programs or (for drawings) some widely 
available drawing editor, and that is suitable for input to text 
formatters or for automatic translation to a variety of formats suitable 
for input to text formatters. A copy made in an otherwise Transparent 
file format whose markup, or absence of markup, has been arranged 
to thwart or discourage subsequent modification by readers is not 


Transparent. 


An image format is not Transparent if used for any substantial 


amount of text. A copy that is not "Transparent" is called "Opaque". 


Examples of suitable formats for Transparent copies include plain 
ASCII without markup, Texinfo input format, LaTeX input format, 
SGML or XML using a publicly available DTD, and standard- 
conforming simple HTML, PostScript or PDF designed for human 
modification. Examples of transparent image formats include PNG, 
XCF and JPG. Opaque formats include proprietary formats that can 
be read and edited only by proprietary word processors, SGML or 
XML for which the DTD and/or processing tools are not generally 
available, and the machine-generated HTML, PostScript or PDF 


produced by some word processors for output purposes only. 


The "Title Page" means, for a printed book, the title page itself, plus 
such following pages as are needed to hold, legibly, the material this 
License requires to appear in the title page. For works in formats 
which do not have any title page as such, "Title Page" means the text 
near the most prominent appearance of the work's title, preceding the 


beginning of the body of the text. 


A section "Entitled XYZ" means a named subunit of the Document 
whose title either is precisely XYZ or contains XYZ in parentheses 
following text that translates XYZ in another language. (Here XYZ 
stands for a specific section name mentioned below, such as 
"Acknowledgements", "Dedications", "Endorsements", or "History".) To 
"Preserve the Title" of such a section when you modify the Document 
means that it remains a section "Entitled XYZ" according to this 


definition. 
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The Document may include Warranty Disclaimers next to the notice 
which states that this License applies to the Document. These 
Warranty Disclaimers are considered to be included by reference in 
this License, but only as regards disclaiming warranties: any other 
implication that these Warranty Disclaimers may have is void and has 


no effect on the meaning of this License. 


2. VERBATIM COPYING 


You may copy and distribute the Document in any medium, either 
commercially or noncommercially, provided that this License, the 
copyright notices, and the license notice saying this License applies to 
the Document are reproduced in all copies, and that you add no 
other conditions whatsoever to those of this License. You may not use 
technical measures to obstruct or control the reading or further 
copying of the copies you make or distribute. However, you may 
accept compensation in exchange for copies. If you distribute a large 
enough number of copies you must also follow the conditions in 


section 3. 


You may also lend copies, under the same conditions stated above, 


and you may publicly display copies. 


3. COPYING IN QUANTITY 


If you publish printed copies (or copies in media that commonly have 
printed covers) of the Document, numbering more than 100, and the 
Document's license notice requires Cover Texts, you must enclose the 
copies in covers that carry, clearly and legibly, all these Cover Texts: 
Front-Cover Texts on the front cover, and Back-Cover Texts on the 
back cover. Both covers must also clearly and legibly identify you as 
the publisher of these copies. The front cover must present the full 
title with all words of the title equally prominent and visible. You may 


add other material on the covers in addition. 


Copying with changes limited to the covers, as long as they preserve 
the title of the Document and satisfy these conditions, can be treated 


as verbatim copying in other respects. 


If the required texts for either cover are too voluminous to fit legibly, 
you should put the first ones listed (as many as fit reasonably) on the 


actual cover, and continue the rest onto adjacent pages. 


If you publish or distribute Opaque copies of the Document 
numbering more than 100, you must either include a machine- 
readable Transparent copy along with each Opaque copy, or state in 
or with each Opaque copy a computer-network location from which 
the general network-using public has access to download using 
public-standard network protocols a complete Transparent copy of 


the Document, free of added material. 


If you use the latter option, you must take reasonably prudent steps, 
when you begin distribution of Opaque copies in quantity, to ensure 
that this Transparent copy will remain thus accessible at the stated 
location until at least one year after the last time you distribute an 
Opaque copy (directly or through your agents or retailers) of that 
edition to the public. 


It is requested, but not required, that you contact the authors of the 
Document well before redistributing any large number of copies, to 
give them a chance to provide you with an updated version of the 


Document. 


4. MODIFICATIONS 


You may copy and distribute a Modified Version of the Document 
under the conditions of sections 2 and 3 above, provided that you 
release the Modified Version under precisely this License, with the 
Modified Version filling the role of the Document, thus licensing 
distribution and modification of the Modified Version to whoever 
possesses a copy of it. In addition, you must do these things in the 
Modified Version: 


A. Use in the Title Page (and on the covers, if any) a title distinct from 
that of the Document, and from those of previous versions (which 
should, if there were any, be listed in the History section of the 
Document). You may use the same title as a previous version if the 


original publisher of that version gives permission. 
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B. List on the Title Page, as authors, one or more persons or entities 
responsible for authorship of the modifications in the Modified 
Version, together with at least five of the principal authors of the 
Document (all of its principal authors, if it has fewer than five), unless 


they release you from this requirement. 


C. State on the Title page the name of the publisher of the Modified 


Version, as the publisher. 


D. Preserve all the copyright notices of the Document. 


E. Add an appropriate copyright notice for your modifications 


adjacent to the other copyright notices. 


F. Include, immediately after the copyright notices, a license notice 
giving the public permission to use the Modified Version under the 


terms of this License, in the form shown in the Addendum below. 


G. Preserve in that license notice the full lists of Invariant Sections and 


required Cover Texts given in the Documents license notice. 


H. Include an unaltered copy of this License. 


|. Preserve the section Entitled "History", Preserve its Title, and add to 
it an item stating at least the title, year, new authors, and publisher of 
the Modified Version as given on the Title Page. If there is no section 
Entitled "History" in the Document, create one stating the title, year, 
authors, and publisher of the Document as given on its Title Page, 
then add an item describing the Modified Version as stated in the 


previous sentence. 


J. Preserve the network location, if any, given in the Document for 
public access to a Transparent copy of the Document, and likewise 
the network locations given in the Document for previous versions it 
was based on. These may be placed in the "History" section. You may 
omit a network location for a work that was published at least four 
years before the Document itself, or if the original publisher of the 


version it refers to gives permission. 


K. For any section Entitled "Acknowledgements" or "Dedications", 
Preserve the Title of the section, and preserve in the section all the 
substance and tone of each of the contributor acknowledgements 


and/or dedications given therein. 


L. Preserve all the Invariant Sections of the Document, unaltered in 
their text and in their titles. Section numbers or the equivalent are not 


considered part of the section titles. 


M. Delete any section Entitled "Endorsements". Such a section may 
not be included in the Modified Version. 


N. Do not retitle any existing section to be Entitled "Endorsements" or 


to conflict in title with any Invariant Section. 


O. Preserve any Warranty Disclaimers. 


If the Modified Version includes new front-matter sections or 
appendices that qualify as Secondary Sections and contain no 
material copied from the Document, you may at your option 
designate some or all of these sections as invariant. To do this, add 
their titles to the list of Invariant Sections in the Modified Version's 
license notice. These titles must be distinct from any other section 


titles. 


You may add a section Entitled "Endorsements", provided it contains 
nothing but endorsements of your Modified Version by various 
parties--for example, statements of peer review or that the text has 
been approved by an organization as the authoritative definition of a 


standard. 


You may add a passage of up to five words as a Front-Cover Text, 
and a passage of up to 25 words as a Back-Cover Text, to the end of 
the list of Cover Texts in the Modified Version. Only one passage of 
Front-Cover Text and one of Back-Cover Text may be added by (or 
through arrangements made by) any one entity. If the Document 
already includes a cover text for the same cover, previously added by 
you or by arrangement made by the same entity you are acting on 
behalf of, you may not add another; but you may replace the old one, 
on explicit permission from the previous publisher that added the old 


one. 
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The author(s) and publisher(s) of the Document do not by this License 
give permission to use their names for publicity for or to assert or 


imply endorsement of any Modified Version. 


5. COMBINING DOCUMENTS 


You may combine the Document with other documents released 
under this License, under the terms defined in section 4 above for 
modified versions, provided that you include in the combination all of 
the Invariant Sections of all of the original documents, unmodified, 
and list them all as Invariant Sections of your combined work in its 


license notice, and that you preserve all their Warranty Disclaimers. 


The combined work need only contain one copy of this License, and 
multiple identical Invariant Sections may be replaced with a single 
copy. If there are multiple Invariant Sections with the same name but 
different contents, make the title of each such section unique by 
adding at the end of it, in parentheses, the name of the original 


author or publisher of that section if known, or else a unique number. 


Make the same adjustment to the section titles in the list of Invariant 


Sections in the license notice of the combined work. 


In the combination, you must combine any sections Entitled "History" 
in the various original documents, forming one section Entitled 
"History"; likewise combine any sections Entitled "Acknowledgements", 
and any sections Entitled "Dedications". You must delete all sections 


Entitled "Endorsements". 


6. COLLECTIONS OF DOCUMENTS 


You may make a collection consisting of the Document and other 
documents released under this License, and replace the individual 
copies of this License in the various documents with a single copy that 
is included in the collection, provided that you follow the rules of this 
License for verbatim copying of each of the documents in all other 


respects. 


You may extract a single document from such a collection, and 
distribute it individually under this License, provided you insert a copy 
of this License into the extracted document, and follow this License in 


all other respects regarding verbatim copying of that document. 


7. AGGREGATION WITH INDEPENDENT WORKS 


A compilation of the Document or its derivatives with other separate 
and independent documents or works, in or on a volume of a storage 
or distribution medium, is called an "aggregate" if the copyright 
resulting from the compilation is not used to limit the legal rights of 


the compilation's users beyond what the individual works permit. 


When the Document is included in an aggregate, this License does 
not apply to the other works in the aggregate which are not 


themselves derivative works of the Document. 


If the Cover Text requirement of section 3 is applicable to these copies 
of the Document, then if the Document is less than one half of the 
entire aggregate, the Document's Cover Texts may be placed on 
covers that bracket the Document within the aggregate, or the 


electronic equivalent of covers if the Document is in electronic form. 


Otherwise they must appear on printed covers that bracket the whole 


aggregate. 


8. TRANSLATION 


Translation is considered a kind of modification, so you may 
distribute translations of the Document under the terms of section 4. 
Replacing Invariant Sections with translations requires special 
permission from their copyright holders, but you may include 
translations of some or all Invariant Sections in addition to the 
original versions of these Invariant Sections. You may include a 
translation of this License, and all the license notices in the Document, 
and any Warranty Disclaimers, provided that you also include the 
original English version of this License and the original versions of 


those notices and disclaimers. In case of a disagreement between the 
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translation and the original version of this License or a notice or 


disclaimer, the original version will prevail. 


If a section in the Document is Entitled "Acknowledgements", 
"Dedications", or "History", the requirement (section 4) to Preserve its 


Title (section 1) will typically require changing the actual title. 


9. TERMINATION 


You may not copy, modify, sublicense, or distribute the Document 
except as expressly provided for under this License. Any other attempt 
to copy, modify, sublicense or distribute the Document is void, and 
will automatically terminate your rights under this License. However, 
parties who have received copies, or rights, from you under this 
License will not have their licenses terminated so long as such parties 


remain in full compliance. 


10. FUTURE REVISIONS OF THIS LICENSE 


The Free Software Foundation may publish new, revised versions of 
the GNU Free Documentation License from time to time. Such new 
versions will be similar in spirit to the present version, but may differ 
in detail to address new problems or concerns. See http:// 


www.gnu.org/copyleft/. 


Each version of the License is given a distinguishing version number. 
If the Document specifies that a particular numbered version of this 
License "or any later version" applies to it, you have the option of 
following the terms and conditions either of that specified version or 
of any later version that has been published (not as a draft) by the 
Free Software Foundation. If the Document does not specify a version 
number of this License, you may choose any version ever published 


(not as a draft) by the Free Software Foundation. 
ADDENDUM: How to use this License for your documents 
To use this License in a document you have written, include a copy of 


the License in the document and put the following copyright and li- 


cense notices just after the title page: 


Copyright (c) YEAR YOUR NAME. 


Permission is granted to copy, distribute and/or modify this 
document under the terms of the GNU Free Documentation License, 
Version 1.2 or any later version published by the Free Software 
Foundation; with no Invariant Sections, no Front-Cover Texts, and no 


Back-Cover Texts. 


A copy of the license is included in the section entitled "GNU Free 


Documentation License". 


If you have Invariant Sections, Front-Cover Texts and Back-Cover 


Texts, replace the "with...Texts." line with this: 


with the Invariant Sections being LIST THEIR TITLES, with the Front- 
Cover Texts being LIST, and with the Back-Cover Texts being LIST. 


If you have Invariant Sections without Cover Texts, or some other 
combination of the three, merge those two alternatives to suit the 


situation. 


If your document contains nontrivial examples of program code, we 
recommend releasing these examples in parallel under your choice 
of free software license, such as the GNU General Public License, to 


permit their use in free software. 
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